Ich habe lange an mehreren Aufgaben für natürliche Sprachverarbeitung gearbeitet. Eines Tages wollte ich eine Karte des NLP -Feldes zeichnen, auf dem ich meinen Lebensunterhalt verdiene. Ich bin sicher, ich bin nicht die einzige Person, die auf einen Blick sehen möchte, den Aufgaben in NLP haben.
Ich habe mein Bestes unternommen, um so viele wie möglich in NLP zu decken, aber zugegebenermaßen ist dies nur aufgrund meines Mangels an Wissen alles andere als erschöpfend. Und ausgewählte Referenzen sind auf jüngste Deep -Lern -Errungenschaften voreingenommen. Ich gehe davon aus, dass diese als Ausgangspunkt dienen, wenn Sie sich mit der Aufgabe befassen. Ich werde dieses Repo immer wieder aktualisieren, aber ich hoffe wirklich, dass Sie an dieser Arbeit zusammenarbeiten. Zögern Sie nicht, mir eine Pull -Anfrage zu schicken!
13. Oktober 2017.
von Kyubyong
Bewertet und aktualisiert von YJ Choe am 18. Oktober 2017.
PAPER automatische Textbewertung mit neuronalen NetzwerkenPAPER Ein neuronaler Ansatz zur automatisierten Bewertung von AufsätzenCHALLENGE Kaggle: Die Hewlett Foundation: Automatisierte AufsatzberechnungPROJECT -Leichtigkeit (erweiterter KI -Bewertungsmotor) WIKI -SpracherkennungPAPER tiefe Sprache 2: End-to-End-Spracherkennung in Englisch und MandarinPAPER : Ein generatives Modell für RAW -AudioPROJECT eine Tensorflow -Implementierung der Deepspeech -Architektur von BaiduPROJECT Speech-to-Text-Wellenet: End-to-End-Satzebene englische Spracherkennung mit DeepMinds WellenetCHALLENGE die 5. Chime -Sprachtrennung und die Anerkennung Herausforderung anDATA Die 5. Chime -Sprachtrennung und ErkennungsherausforderungDATA CSTR VCTK CorpusDATA Librispeech ASR CorpusDATA -1-Telefon-SprachkorpusDATA Ted-Lium CorpusDATA offene Sprach- und SprachressourcenDATA gemeinsame Stimme WIKI Automatische ZusammenfassungBOOK automatische TextübersichtPAPER -Zusammenfassung unter Verwendung neuronaler NetzePAPER mit rekursiven neuronalen Netzwerken und ihrer Anwendung auf die Zusammenfassung der MehrfachdokumentDATA Text Analytics Conferences (TAC)DATA verstehen Konferenzen (DUC) INFO -Coreference -AuflösungPAPER tiefe Verstärkungslernen für erwähnte Ranking-KoreferenzmodellePAPER Verbesserung der Korferenzauflösung durch verteilte Darstellungen auf LernentitätsebeneCHALLENGE Conll 2012 Shared Task: Modellierung mehrsprachiger uneingeschränkter Kernvorgänge in OntonotesCHALLENGE Conll 2011 Shared Task: Modellierung uneingeschränkter Kernvorgänge in OntonotesCHALLENGE für Semeval 2018 Aufgabe 4: Charakteridentifikation auf mehrteiligen Dialogen PAPER Ein mehrschichtiger Faltungs-Encoder-Decoder Neural Network für die grammatikalische FehlerkorrekturPAPER -Übersetzungsmodelle für neuronale Netzwerks für die grammatikalische FehlerkorrekturPAPER für die SatzkorrekturCHALLENGE CONLL-2013 Shared Aufgabe: Grammatikalistische KorrekturCHALLENGE CONLL-2014 Shared Aufgabe: Grammatikalische FehlerkorrekturDATA NUS Nichtkommerzielle Forschungs-/Versuchskorpus-LizenzDATA Lang-8-LernkörperDATA Cornell Movie-Dialogs CorpusPROJECT Deep Text CorrectorPRODUCT tiefe Grammatik PAPER -Graphem-zu-Phonem-Modelle für (fast) jede SprachePAPER Polyglot-Modelle Neural Sprache: Eine Fallstudie zum landübergreifenden phonetischen RepräsentationslernenPAPER -Multitask-Sequenz-zu-Sequenz-Modelle für die Konvertierung von Graphem-zu-PhonemPROJECT zu Sequenz G2P ToolkitPROJECT G2P_EN: Ein einfaches Python -Modul für englisches Graphem zu Phonem ConversionDATA mehrsprachige Aussprachedaten PAPER automatischer Sarkasmuserkennung: Eine UmfragePAPER für Sarkasmus: Sarkasmus -Erkennung rechtzeitig, kontextuell und sehr persönlich machenPAPER auf Twitter: Ein VerhaltensmodellierungsansatzCHALLENGE Semeval-2017 Aufgabe 6: #Hashtagwars: Lernen Sie einen Sinn für HumorCHALLENGE für Semeval-2017 Aufgabe 7: Erkennung und Interpretation englischer WortspieleDATA sarkastische Kommentare von RedditDATA Sarkasm Corpus V2DATA Amazon Reviews Corpus WIKI Symbol ErdungsproblemPAPER das Symbol ErdungsproblemPAPER von Phonemen bis zu Bildern: Repräsentationsebenen in einem wiederkehrenden neuronalen Modell des visuell gedeckten SprachlernensPAPER der Phonologie in einem wiederkehrenden neuronalen Modell der geerdeten SprachePAPER für die aufgabenorientierte Sprach ErdungPAPER Sound-Wort2VEC: Lernwortdarstellungen, die in Geräuschen begründet sindCOURSE Sprache Erdung für Vision und KontrolleWORKSHOP -Sprachgrund für Robotik WIKI -SprachidentifizierungPAPER automatische Sprachidentifikation mit tiefen neuronalen NetzwerkenPAPER natürlicher Sprache mit kleinen Feed-Forward-NetzwerkenCHALLENGE 2015 Spracherkennungsbewertung WIKI -SprachmodellTOOLKIT Kenlm Sprachmodell ToolkitPAPER verteilte Darstellungen von Wörtern und Phrasen und ihre KompositionalitätPAPER von Sequenzen mit wiederkehrenden neuronalen NetzwerkenPAPER charakterbewusste neuronale SprachmodelleTHESIS statistische Sprachmodelle basierend auf neuronalen NetzwerkenDATA Penn TreebankTUTORIAL TensorFlow Tutorial zur Sprachmodellierung mit wiederkehrenden neuronalen Netzwerken WIKI LemmatisationPAPER Lemmatisierung und morphologisches Markieren mit LemmingTOOLKIT WordNet LemmatizerDATA TreeBank-3 WIKIPAPER Lipnet: End-to-End-Lipreading auf SatzebenePAPER Sätze in freier WildbahnPAPER groß angelegte visuelle SpracherkennungPROJECT Lip Reading - Cross Audio -visuelle Erkennung unter Verwendung von 3D -FaltungsnetzwerkenPRODUCT LiopaDATA Der Grid Audiovisual Sätze KorpusDATA Der Datensatz von BBC-Oxford 'Multi-View Lip Reading Sätzen (MV-LRS) PAPER durch gemeinsames Lernen, sich auszurichten und zu übersetzenPAPER in linearer ZeitPAPER ist alles was Sie brauchenPAPER sechs Herausforderungen für die Übersetzung neuronaler MaschinenPAPER -basierte und neuronale unbeaufsichtigte maschinelle ÜbersetzungCHALLENGE den neunten Workshop der ACL 2014 zur statistischen maschinellen ÜbersetzungCHALLENGE EMNLP 2017 Zweite Konferenz zur maschinellen Übersetzung (WMT17)DATA openSubtitles2016DATA Wit3: Web -Inventar von transkribierten und übersetzten GesprächenDATA Der QED -Corpus von QCRI -Bildungsbereich (QED)PAPER Multi-Task-Sequenz zum SequenzlernenPAPER unbeaufsichtigtes Vorbau für die Sequenz zum SequenzlernenPAPER Googles mehrsprachiger neuronaler Maschinenübersetzungssystem: Aktivierung der Übersetzung von Zero-ShotTOOLKIT Subword Neural Machine Translation mit Bytepaar -Codierung (BPE)TOOLKIT mehrwegen neuronaler maschineller ÜbersetzungTOOLKIT OpenNMT: Open-Source-Toolkit für neuronale maschinelle Übersetzung WIKI -BeugungPAPER Beugung Erzeugung unter Verwendung von Charaktersequenz zum SequenzlernenCHALLENGE Sigmorphon 2016 Shared Aufgabe: Morphologische ReinflexionDATA Sigmorphon2016 WIKI -Entität VerknüpfungPAPER robuste und kollektive Entität Disambiguation durch semantische Einbettungen WIKI Named-Intity-AnerkennungPAPER neuronale Architekturen für die genannte EntitätserkennungPROJECT OSU Twitter NLP ToolsCHALLENGE wurde zur Erkennung von Entität in Twitter bezeichnetCHALLENGE conll 2002 Sprachunabhängige namens EntitätserkennungCHALLENGE Einführung in die gemeinsame Aufgabe der CONLL-2003: Sprachunabhängige namens EntitätserkennungDATA conll-2002 Ner CorpusDATA conll-2003 Ner CorpusDATA benannte Entitätserkennung in Twitter Shared AufgabeTOOLKIT Stanford ernannte Entitätserkenner PAPER und Entfaltung rekursiger Autoencoder für die ParaphraserkennungPROJECT Paralex: Paraphrase-gesteuerte Lernen für die Beantwortung offener FrageCHALLENGE Semeval-2015 Aufgabe 1: Paraphrase und semantische Ähnlichkeit in TwitterDATA Microsoft Research Paraphrase CorpusDATA Microsoft Research Video Beschreibung KorpusDATA Pascal DatasetDATA -DatensatzDATA des KrankheitsdatensatzesDATA PPDB: Die Paraphrase -DatenbankDATA Wikianswers paraphrasieren Korpus PAPERDATA für die Erzeugung von Daten neuronaler Paraphrase mit gestapelten Rest -LSTM -NetzwerkenCODE Neural Paraphrase Generation mit gestapelten Rest -LSTM -NetzwerkenPAPER Ein tief generativer Rahmen für die Paraphrase -ErzeugungPAPER mit neuronaler maschineller Übersetzung neu besucht WIKI ParsenTOOLKIT the Stanford Parser: Ein statistischer ParserTOOLKIT Spacy ParserPAPER Grammatik als FremdsprachePAPER Ein schneller und genauer Abhängigkeitsparser mit neuronalen NetzwerkenPAPER Universal Semantic ParsingCHALLENGE Conll 2017 Shared Task: Mehrsprachige Parsen vom Rohtext zu universellen AbhängigkeitenCHALLENGE Conll 2016 Shared Aufgabe: Mehrsprachiger flacher Diskurs ParsengingCHALLENGE Conll 2015 Shared Task: Flachdiskurs ParsengingCHALLENGE Semeval-2016 Aufgabe 8: Die Bedeutungsdarstellungen können abstrakt sein, aber diese Aufgabe ist konkret! WIKI -Teil des Speech-TaggingsPAPER mehrsprachiger Teil des Speech-Taggings mit bidirektionalen Langzeit-Kurzzeitgedächtnismodellen und HilfsverlustPAPER unbeaufsichtigtes Teil des Speech-Tagging mit Anker-Hidden Markov-ModellenDATA TreeBank-3TOOLKIT nltk.tag -Paket WIKI Pinyin -EingangsmethodePAPERPROJECT neuronaler chinesischer Transiterator WIKI -Frage BeantwortungPAPER fragen Sie mich alles: Dynamische Speichernetzwerke für die Verarbeitung natürlicher SprachePAPER Speichernetzwerke für visuelle und textliche BeantwortungCHALLENGE die TREC -Frage -Beantwortungsaufgabe herausCHALLENGE NTCIR-8: Fortgeschrittene grenzüberschreitende Informationszugriff (ACLIA)CHALLENGECHALLENGE Semeval-2017 Aufgabe 3: Beantwortung der Community-FrageCHALLENGE Semeval-2018 Aufgabe 11: Maschinenverständnis mit gesundenem WissenDATA MS Marco: Microsoft -Maschinen -Leading -Verständnis -DatensatzDATA Maluuba NewsqaDATA Squad: Über 100.000 Fragen zum Maschinenverständnis des TextesDATA : Eine charakteristisch reiche Frage, die den Datensatz beantwortetDATA Story Cloze Test und Rocstories CorporaDATA Microsoft Research Wikiqa CorpusDATA DeepMind Q & A -DatensatzDATA QasentDATA WIKI -BeziehungsextraktionPAPER Ein tiefer Lernansatz für die Beziehungsextraktion aus Interaktionskontext im Social Manufacturing ParadigmaCHALLENGE Semeval-2018 Aufgabe 7 Semantische Beziehung und Klassifizierung in wissenschaftlichen Arbeiten semantische Beziehung und Klassifizierung WIKI Semantic RollenmarkierungBOOK der semantischen RollePAPER End-to-End-Lernen der semantischen Rollenkennzeichnung mit rezidivierenden neuronalen NetzwerkenPAPER neuronales semantische Rollenmarkierung mit AbhängigkeitspfaddingsPAPER Deep Semantic Rollenkennzeichnung: Was funktioniert und was als nächstes kommtCHALLENGE Conll-2005 Shared Task: Semantische RollenkennzeichnungCHALLENGE CONLL-2004 Shared Task: Semantische RollenkennzeichnungTOOLKIT Illinois Semantic Rollen -Laber (SRL)DATA conll-2005 Shared Aufgabe: Semantische Rollenkennzeichnung WIKI -Satzgrenze DisambiguationPAPER eine quantitative und qualitative Bewertung der Satzgrenzerkennung für die klinische DomäneTOOLKIT NLTK TokenizerDATA Der britische NationalkorpusDATA -1-Telefon-Sprachkorpus WIKI -SentimentanalyseINFO fantastische SentimentanalyseCHALLENGE Kaggle: UMich SI650 - Sentiment -KlassifizierungCHALLENGE Semeval-2017 Aufgabe 4: Stimmungsanalyse in TwitterCHALLENGE Semeval-2017 Aufgabe 5: feinkörnige Stimmungsanalyse zu finanziellen Mikroblogs und NachrichtenPROJECT SenticnetPROJECT Stanford NLP Group Sentiment AnalysisDATA Multi-Domänen-Sentiment-Datensatz (Version 2.0)DATA Stanford Sentiment TreebankDATA Twitter Sentiment CorpusDATA Twitter Sentiment Analysis Training CorpusDATA afinn: Liste der englischen Wörter, die für Valenz bewertet wurden PAPER -basierte Gebärdensprachenerkennung ohne zeitliche SegmentierungPAPER : End-to-End-Handform und kontinuierliche SchärfsprachenerkennungDATA rwth-phoenix-WetterDATA ASLLRPPROJECT PAPER singende Sprachsynthese basierend auf tiefen neuronalen NetzwerkenPAPER Eine neuronale parametrische Gesangssynthesizer -Modellierung Timbre und Ausdruck aus natürlichen LiedernPRODUCT Vocaloid: Voice -Synthese -Technologie und -Software, die von Yamaha entwickelt wurdeCHALLENGE Special Session Interspeech 2016 Singen Synthese Herausforderung "Füllung der Lücke" WORKSHOP NLP+CSS: Workshops zur Verarbeitung natürlicher Sprachverarbeitung und ComputersozialwissenschaftTOOLKIT Männer auch wie einkaufen: Reduzierung der Verstärkung der Geschlechterverzerrung mithilfe von Einschränkungen auf KorpusebeneTOOLKIT Online -Variation Bayes für die latente Dirichlet -Zuordnung (LDA)GROUP des Wissenslabors der Universität von Chicago WIKI -QuelltrennungPAPER von blind bis geführte AudioquellenabtrennungPAPER von Masken und tiefen wiederkehrenden neuronalen Netzwerken für die monaurale QuellentrennungCHALLENGE Signal Separation Evaluation Campaign (SISEC)CHALLENGE WIKI Speaker DiarisierungPAPER DNN-Basis-Lautsprecher-Clustering für die Diarisierung der SprecherPAPER unbeaufsichtigte Methoden zur Sprecherdurch Diatisierung: ein integrierter und iterativer AnsatzPAPER Audio-visuelles Sprecherdurch Diatizing Basierend auf räumlich-zeitlichen Bayes'schen FusionCHALLENGE eine reiche Transkriptionsbewertung WIKI -Sprecher -AnerkennungPAPER Ein neuartiges Schema für die Erkennung von Sprechern unter Verwendung eines phonetisch bewussten tiefen neuronalen NetzwerksPAPER tiefe neuronale Netze für kleine fußabdrucktextabhängige LautsprecherüberprüfungPAPER tiefen Sprecher: Ein End-to-End-Einbettungssystem für neuronale SprecherPROJECT Voice Vector: Welcher der Hollywood -Stars ist meiner Stimme am ähnlichsten?CHALLENGE der Bewertung der Erkennung von NIST Speaker Recognition (SRE)INFO Geben Sie Vorschläge für kostenlose Datenbanken zur Erkennung von Sprechern?DATA voxceleb2: Tiefensprechererkennung WIKI rede_segmentationPAPER von 8 Monate alten: Wenn Sprachhinweise mehr als Statistik zählenPAPER unbeaufsichtigtes Wortsegmentierung und Lexikonentdeckung unter Verwendung von akustischen WortbettendingsPAPER unbeaufsichtigtes Lexikonentdeckung aus akustischer EingabePAPER schwach beaufsichtigte gesprochene Begriff Entdeckung unter Verwendung von übersprachigen SeiteninformationenDATA Callhome Spanische Sprache WIKI -SprachsynthesePAPER natürliche TTSPAPER : Ein generatives Modell für RAW -AudioPAPER Tacotron: Auf dem Weg zu End-to-End-SprachsynthesePAPER Deep Voice 3: 2000-Lautsprecher Neuraltext-zu-SprachePAPER effizient trainierbares Text-zu-Sprache-System basierend auf tiefen Faltungsnetzen mit geführter AufmerksamkeitDATA die Welt englische BibelDATA LJ SprachdatensatzDATACHALLENGE Blizzard Challenge 2017PRODUCT LyrebirdPROJECT das Festvox -ProjektTOOLKIT Merlin: Das NN -basierte Sprachsynthese -System des neuronalen Netzwerks (NN) WIKI -SprachverbesserungBOOK Verbesserung: Theorie und PraxisPAPER Eine experimentelle Studie zur Sprachverbesserung basierendPAPER Ein Regressionsansatz zur Sprachverbesserung basierende DatenepneuralnetworksPAPER basierend auf einer tiefen Denoising AutoCoder WIKI StemmingPAPER Ein Backpropagation Neurales Netzwerk zur Verbesserung des arabischen StammesTOOLKIT NLTK -Stemmers WIKI -Terminologie -ExtraktionPAPER für neuronale Aufmerksamkeitsmodelle für die Sequenzklassifizierung: Analyse und Anwendung auf die Erkennung von Schlüsselbegriffen und Dialoggesetze WIKI Semantische ÄhnlichkeitPAPER Eine Übersicht über TextähnlichkeitsansätzePAPER lernen, kurze Textpaare mit faltungslosen tiefen neuronalen Netzwerken einzustufenPAPER verbesserte semantische Darstellungen aus baumstrukturierten langen Kurzzeit-Speicher-NetzwerkenCHALLENGE für Semeval-2014 Aufgabe 3: Semantische Ähnlichkeit der Semantik über KreuzungCHALLENGE Semeval-2014 Aufgabe 10: Mehrsprachige semantische textuelle ÄhnlichkeitCHALLENGE Semeval-2017 Aufgabe 1: Semantische textuelle ÄhnlichkeitWIKI Semantic Textual Ähnlichkeit Wiki WIKI -Textver einfacherlangungPAPER , die Sätze von Standard -Wikipedia auf einfache Wikipedia ausrichtenPAPER in der aktuellen Textvereinfachungsforschung: Neue Daten können helfenDATA Newsela -Daten WIKIPROJECT mit TensorFlowPAPER mit strukturierten Aufmerksamkeiten und ZusammensetzungCHALLENGE Semeval-2014 Aufgabe 1: Bewertung von semantischen Modellen der Kompositionsverteilung für vollständige Sätze durch semantische Verwandtschaft und TextbeschaffungCHALLENGE Semeval-2013 Aufgabe 7: Die gemeinsame Analyse der Reaktion der Schüler und 8. Anerkennung von Textverwaltungsherausforderungen WIKI -TransliterationINFO Transliteration von Nicht-Latin-SkriptenPAPER Ein tiefer Lernansatz zur maschinellen TransliterationCHALLENGE News 2016 Shared Aufgabe zur Transliteration benannter UnternehmenPROJECT Neuronal Japanische Transliteration - Kannst du es besser machen als die Tastatur der Swiftkey ™? PAPER phonetische Posteriorgrams für viele zu eins-Sprachumwandlungen ohne paralleles DatentrainingPROJECT Deep Neural Networks für Sprachumwandlung (Sprachstiltransfer) im TensorFlowPROJECT eine Implementierung des Sprachumwandlungssystems unter Verwendung von phonetischen PosteriorgramsCHALLENGE Voice Conversion Challenge 2016CHALLENGE Voice Conversion Challenge 2018DATA CMU_Arctic SpeechsynthesedatenbankenDATA akustisch-phonetischer kontinuierlicher Sprachkorpus WIKI Wort EinbettungTOOLKIT Gensim: Word2VecTOOLKIT FastTextTOOLKIT Handschuh: Globale Vektoren für die WortrepräsentationINFO wo ein vorgezogenes Modell erhalten werden kannPROJECT Vektoren vor ausgebildetem WortPROJECT Vektoren von über 30 Sprachen vorgeschriebenPROJECT Polyglot: Verteilte Wortdarstellungen für mehrsprachige NLPPROJECT BPEMB: Eine Sammlung von vorgeborenen Subword-Einbettungen in 275 SprachenCHALLENGE Semeval 2018 Aufgabe 10 Erfassen diskriminierender AttributePAPER -Wortbettendings für die maschinelle Übersetzung von PhrasenbasisPAPER Eine Übersicht über brichtliche Einbettungsmodelle INFO Was ist Wortvorhersage?PAPER Die Vorhersage des Charakters basierend auf wiederkehrenden neuronalen NetzwerksprachenmodellPAPER eine eingebettete, tief lernbasierte WortvorhersagePAPER der Wortvorhersage: Rahmen TastenanschlageinsparungenDATA eine eingebettete tief lernbasierte WortvorhersagePROJECT Word Prediction unter Verwendung von Faltungsnetzwerken - können Sie es besser als die iPhone ™ -Tastatur machen?CHALLENGE für Semeval-2018 Aufgabe 2, Mehrsprachige Emoji-Vorhersage WIKI -WortsegmentierungPAPER neuronales Wort Segmentierung Lernen für ChinesischPROJECT mit projektverkäuftem neuronalem Netzwerk für die chinesische WortsegmentierungTOOLKIT Stanford Word -SegmentiererTOOLKIT NLTK Tokenizer DATAPAPER -o-Matic: Große DISKAMBIGUUNGEN IN VOLUGENDE WORKLICHE WORDSEINEN SIND Ohne manuelle TrainingsdatenDATA Train-O-Matic-DatenDATA Babelnet