nlp_tasks
1.0.0
나는 오랫동안 여러 자연어 처리 작업을 수행 해 왔습니다. 어느 날, 나는 생계를 유지하는 NLP 필드의지도를 그리는 것을 느꼈습니다. 나는 어떤 작업이 NLP에 있는지보고 싶어하는 유일한 사람이 아니라고 확신합니다.
나는 NLP에서 가능한 많은 작업을 다루기 위해 최선을 다했지만, 이것은 지식이 부족하기 때문에 전적으로 철저한 것과는 거리가 멀었습니다. 선택된 참조는 최근의 딥 러닝 성과에 편향되어 있습니다. 나는 당신이 작업을 파헤칠 때 이것이 시작점 역할을 할 것으로 기대합니다. 이 저장소를 직접 업데이트하겠습니다. 그러나 내가 정말로 희망하는 것은이 작품에 대해 협력하는 것입니다. 주저하지 말고 풀 요청을 보내주세요!
2017 년 10 월 13 일.
Kyubyong에 의해
2017 년 10 월 18 일에 YJ Choe가 검토 및 업데이트했습니다.
PAPER 자동 텍스트 점수PAPER 자동 에세이 스코어링에 대한 신경 접근CHALLENGE Kaggle : Hewlett Foundation : 자동 에세이 스코어링PROJECT 편의 (향상된 AI 스코어링 엔진) WIKI 음성 인식PAPER Deep Speech 2 : 영어 및 만다린의 엔드 투 엔드 음성 인식PAPER wavenet : 원시 오디오를위한 생성 모델PROJECTPROJECT 연설-텍스트 -wavenet : DeepMind 's Wavenet을 사용한 엔드 대 엔지스 수준 영어 음성 인식CHALLENGEDATA 5 번째 차임 연설 분리 및 인식 도전DATA CSTR VCTK 코퍼스DATA librispeech ASR 코퍼스DATA 전환 보드 -1 전화 연설 코퍼스DATA TED-LIUM 코퍼스DATA 공개 음성 및 언어 리소스DATA 공통 음성 WIKI 자동 요약BOOKPAPER 텍스트 요약PAPER 순위DATA 텍스트 분석 컨퍼런스 (TAC)DATA 문서 컨퍼런스 이해 (DUC) INFO 혼합 해상도PAPER 깊은 강화 학습PAPER 회의 해상도 개선 용지CHALLENGE Conll 2012 공유 작업 : Ontonotes의 다국어 무제한 혼합 모델링CHALLENGE 2011 공유 작업 : Ontonotes의 무제한 코퍼레이션 모델링CHALLENGE Semeval 2018 작업 4 : 다자 대화에 대한 문자 식별 PAPER 문법 오류 수정을위한 다층 컨볼 루션 인코더 디코더 신경망PAPER 신경망 번역 모델PAPER 적응 시퀀스 모델CHALLENGE -2013 공유 작업 : 문법 오류 수정CHALLENGE -2014 공유 작업 : 문법 오류 수정DATA NUS 비상업적 연구/시험 코퍼스 라이센스DATA lang-8 학습자 CorporaDATA 코넬 영화-디 알로그 코퍼스PROJECTPRODUCT 깊은 문법 PAPER grapheme-to-phoneme 모델PAPER Polyglot Neural Language Models : 문구 간 발음 학습의 사례 연구PAPER 멀티 태스킹 시퀀스-시퀀스 모델PROJECT 시퀀스-시퀀스 G2P 툴킷PROJECT G2P_EN : 영어 Grapheme to Phoneme 변환을위한 간단한 파이썬 모듈DATA 다국어 발음 데이터 PAPER 자동 풍자 탐지 : 조사PAPER 종이 자석 : 풍자적 탐지를 적시에, 상황에 맞는, 매우 개인적으로 만드는PAPER 풍자 탐지 : 행동 모델링 접근법CHALLENGE Semeval-2017 과제 6 : #hashtagwars : 유머 감각 학습CHALLENGE Semeval-2017 과제 7 : 영어 말장난의 탐지 및 해석DATA 냉담한 의견DATA Sarcasm Corpus v2DATA 풍자 아마존은 코퍼스를 검토합니다 WIKI 기호 접지 문제PAPERPAPER : 시각적으로 지하면 언어 학습의 반복적 인 신경 모델에서의 표현 수준PAPER 인코딩PAPER 게이트-입장 아키텍처PAPER Sound-Word2Vec : 소리에 기초한 단어 표현을 배우는 학습COURSE 언어 근거WORKSHOP 언어 접지 WIKI 어 식별PAPER 자동 언어 식별PAPER 자연어 처리CHALLENGE 2015 언어 인식 평가 WIKI 어 모델TOOLKIT Kenlm 언어 모델 툴킷PAPER 분산 표현 및 구성 성PAPER 생성 서열PAPER 특성 인식 신경 언어 모델THESIS 통계 언어 모델DATA 펜 트리 뱅크TUTORIAL 텐서 플로우 자습서 WIKI 레마 화PAPER 관절 lemmatization 및 lemming을 사용한 형태 학적 태깅TOOLKIT Wordnet LemmatizerDATA 트리 뱅크 -3 WIKI 립 독서PAPER Lipnet : 엔드 투 엔도 문장 수준의 립 리딩PAPER 종이 립 독서 문장PAPER 대규모 시각적 음성 인식PROJECT 립 독서 - 3D 컨볼 루션 신경망을 사용한 교차 시청각 인식PRODUCT liopaDATA 그리드 시청각 문장 코퍼스를 데이터DATA BBC-Oxford '다중 뷰 립 독서 문장'(MV-LRS) 데이터 세트 PAPER 신경 기계 번역PAPER 신경 기계 번역PAPER 관심 만 있으면됩니다PAPERPAPER 구절 기반 및 신경 비 감독 기계 번역CHALLENGECHALLENGE EMNLP 2017 기계 번역에 관한 두 번째 회의 (WMT17)DATA 오프 티틀2016DATA WIT3 : 전사 및 번역 된 대화의 웹 인벤토리DATA QCRI 교육 도메인 (QED) 코퍼스PAPER 멀티 태스크 시퀀스PAPER 비 감독 사전 조정PAPER Google의 다국어 신경 기계 번역 시스템 : 제로 샷 번역 활성화TOOLKIT 서브 워드 신경 기계 번역TOOLKIT 다중 웨이 신경 기계 번역TOOLKIT OpenNMT : 신경 기계 번역을위한 오픈 소스 툴킷 WIKI 변곡PAPER 형태 학적 변곡 생성CHALLENGEDATA sigmorphon2016 WIKI 엔터티 링크PAPER 강력하고 집단적 실체는 의미 론적 임베딩을 통한 명확성 WIKI 라는 이름의 엔티티 인식PAPER 신경 아키텍처PROJECT OSU 트위터 NLP 도구CHALLENGECHALLENGE 2002 언어 독립적 인 이름 지정된 엔티티 인식CHALLENGE : 언어 독립적 인 이름 지정된 엔티티 인식DATA conll-2002 ner corpusDATA conll-2003 ner corpusDATA 너트TOOLKIT Stanford는 Entity Celloizer를 지명했습니다 PAPER 인 풀링 및 펼쳐지는 반복적 인자가 인코더를 역 동작 탐지를위한PROJECT Paralex : 공개 질문 답변에 대한 Paraphrase-Driven 학습CHALLENGE SEMEVAL-2015 과제 1 : 트위터의 역설 및 의미 론적 유사성DATA Microsoft Research Paraphrase CorpusDATA 마이크로 소프트 연구 비디오 설명 코퍼스DATA 파스칼 데이터 세트DATA 플리커 데이터 세트DATADATA PPDB : Paraphrase 데이터베이스DATA Wikianswers Paraphrase Corpus PAPER 신경구 생성DATA 신경 역사 생성CODEPAPER 역할 생성을위한 깊은 생성 프레임 워크PAPER 역설 WIKI 파싱TOOLKIT Stanford 파서 : 통계 파서TOOLKIT 스파이 파서PAPER 문법PAPERPAPER 보편적 시맨틱 파싱CHALLENGE 2017 공유 작업 : 원시 텍스트에서 보편적 의존성까지 다국어 구문 분석CHALLENGE 2016 공유 작업 : 다국어 얕은 담론 구문 분석CHALLENGE 2015 공유 과제 : 얕은 담론 구문 분석CHALLENGE Semeval-2016 과제 8 : 의미 표현은 추상적 일 수 있지만이 작업은 구체적입니다! WIKI 부품 연설 태그PAPER 다국어 부품 태그PAPER 되지 않은 부분-연설 태그DATA 트리 뱅크 -3TOOLKIT nltk.tag 패키지 WIKI Pinyin 입력 방법PAPER 신경망 언어 모델PROJECT 신경 중국 경로자 WIKI 질문 응답PAPER 에게 묻습니다 : 자연어 처리를위한 동적 메모리 네트워크PAPER 동적 메모리 네트워크CHALLENGECHALLENGE NTCIR-8 : ACLIA (Advanced Cross-LINGUAL 정보 액세스)CHALLENGE 질문에 도전하십시오CHALLENGE 작업 3 : 커뮤니티 질문 답변CHALLENGE 과제 11 : 상식 지식을 사용한 기계 이해력DATA MS Marco : Microsoft Machine 읽기 포괄적 인 데이터 세트DATA Maluuba NewsqaDATA 분대 : 텍스트의 기계 이해력에 대한 10 만 개 이상의 질문DATA 그래프 퀘스트 : 특징이 풍부한 질문 답변 데이터 세트DATA 스토리 클로즈 테스트 및 Rocstories CorporaDATA Microsoft Research Wikiqa CorpusDATA 심해 Q & A 데이터 세트DATA QasentDATA 교과서 질문 답변 WIKI 관계 추출PAPER 사회 제조 패러다임에서 상호 작용 맥락에서 관계 추출을위한 딥 러닝 접근법CHALLENGE SEMEVAL-2018 과제 7 과학 논문에서의 의미 론적 관계 추출 및 분류 WIKI 시맨틱 역할 라벨링BOOKPAPER 신경 네트워크를 이용한 의미 론적 역할 라벨링의 종이 종료 간 학습PAPER 신경 시맨틱 역할 라벨링PAPER 깊은 의미 론적 역할 라벨링 : 작동하는 것과 다음의 것CHALLENGE -2005 공유 작업 : 시맨틱 역할 라벨링CHALLENGE -2004 공유 작업 : 시맨틱 역할 라벨링TOOLKIT 일리노이 의미 론적 역할 레이더 (SRL)DATA Conll-2005 공유 작업 : 시맨틱 역할 라벨링 WIKI 문장 경계 명확성PAPER 임상 영역에 대한 문장 경계 탐지의 정량적 및 질적 평가TOOLKIT NLTK 토큰 화제DATA 영국 국립 코퍼스DATA 전환 보드 -1 전화 연설 코퍼스 WIKI 감정 분석INFO 굉장한 감정 분석CHALLENGE Kaggle : Umich SI650- 감정 분류CHALLENGE 과제 4 : 트위터의 감정 분석CHALLENGE SEMEVAL-2017 과제 5 : 금융 마이크로 블로그 및 뉴스에 대한 세밀한 감정 분석PROJECT SenticnetPROJECT 스탠포드 NLP 그룹 감정 분석DATA 다중 도메인 감정 데이터 세트 (버전 2.0)DATA 스탠포드 감정 트리 뱅크DATA 트위터 감정 코퍼스DATA 트위터 감정 분석 교육 코퍼스DATA afinn : 원자가에 대한 영어 단어 목록 PAPER 기반 수화 인식PAPER 서브 유닛 : 엔드 투 엔드 핸드 모양 및 연속 수화 인식DATA RWTH-PHOENIX-WHEATHERDATA asllrpPROJECT 서명 PAPER 노래 음성 합성PAPER 신경 파라 메트릭 노래 신디사이저 모델링 음모와 자연 노래의 표현PRODUCT Vocaloid : Yamaha가 개발 한 음성 합성 기술 및 소프트웨어CHALLENGE 특별 세션 Interspeech 2016 노래 합성 챌린지 "갭 필인" WORKSHOP NLP+CSS : 자연 언어 처리 및 계산 사회 과학에 관한 워크샵TOOLKIT 남성도 쇼핑을 좋아합니다 : 코퍼스 수준의 제약을 사용하여 성 편견 증폭 감소TOOLKIT 온라인 변형 베이 (LDA)GROUP WIKI 소스 분리PAPERPAPER 관절 최적화CHALLENGE 신호 분리 평가 캠페인 (SISEC)CHALLENGE WIKI 스피커 참기PAPER DNN 기반 스피커 클러스터링PAPER 되지 않은 용지 : 통합 및 반복적 접근PAPER 시청각 스피커 발기CHALLENGE WIKI 스피커 인식PAPER 계획PAPER 깊은 신경망PAPER Deep Speaker : 엔드 투 엔드 신경 화자 임베딩 시스템PROJECT Voice Vector : 할리우드 스타 중 어느 것이 내 목소리와 가장 유사합니까?CHALLENGE NIST 스피커 인식 평가 (SRE)INFO 스피커 인식을위한 무료 데이터베이스에 대한 제안이 있습니까?DATA VoxcelEB2 : 깊은 스피커 인식 WIKI Speech_SegmentationPAPER 신호가 통계보다 더 많이 계산할 때PAPER 비 감독 단어 세분화 및 어휘 발견PAPER 비 감독 사전 발견PAPER 상호 언어 측면 정보를 사용하여 약하게 감독 된 구어체 발견DATA 콜 홈 스페인어 연설 WIKI 연설 합성PAPER 자연 TTS 합성PAPER wavenet : 원시 오디오를위한 생성 모델PAPER 타코트론 : 엔드 투 엔드 언어 합성을 향해PAPER 깊은 음성 3 : 2000 스피커 신경 텍스트 음주PAPER 효율적으로 훈련 가능한 텍스트 음성 음성 시스템DATADATA LJ 음성 데이터 세트DATA 적은 데이터CHALLENGE 블리자드 챌린지 2017PRODUCT LyrrebirdPROJECTTOOLKIT 멀린 : 신경망 (NN) 기반 음성 합성 시스템 WIKI 연설 향상BOOK 연설 향상 : 이론과 실습PAPER 언어 향상에 대한 실험적 연구를 기반으로합니다PAPERPAPER 음성 향상 WIKI 스템 밍PAPER 아라비아 스템 밍을 개선하기위한 역전 신경망TOOLKIT nltk stemmers WIKI 용어 추출PAPER 신경주의 모델 : 주요 용어 추출 및 대화 행위 탐지에 대한 분석 및 적용 WIKI 시맨틱 유사성PAPER 텍스트 유사성 접근법에 대한 조사PAPER 학습PAPER 구조화 된 긴 단기 메모리 네트워크에서 시맨틱 표현 향상CHALLENGE Semeval-2014 과제 3 : 교차 수준의 의미 론적 유사성CHALLENGE -2014 TASK 10 : 다국어 시맨틱 텍스트 유사성CHALLENGE 과제 1 : 시맨틱 텍스트 유사성WIKI 시맨틱 텍스트 유사성 위키 WIKI 텍스트 단순화PAPER 합니다PAPER 문제 : 새로운 데이터가 도움이 될 수 있습니다.DATA 뉴 셀라 데이터 WIKI 텍스트 수입PROJECT 텍스트 수반PAPER 텍스트 수반CHALLENGE SEMEVAL-2014 과제 1 : 의미 론적 관련성 및 텍스트 entailment를 통해 전체 문장에 대한 구성 분포 의미 론적 모델 평가CHALLENGE SEMEVAL-2013 과제 7 : 공동 학생 응답 분석 및 8 번째 인식 텍스트 수입 도전 WIKI 경로INFO 음역PAPER 기계 음역에 대한 딥 러닝 접근CHALLENGE 뉴스 2016 지명 된 엔티티의 음역에 대한 공유 작업PROJECT 신경 일본 음역 - Swiftkey ™ 키보드보다 더 잘할 수 있습니까? PAPER 음성 사후 그램PROJECTPROJECTCHALLENGE 음성 변환 챌린지 2016CHALLENGE 음성 변환 챌린지 2018DATA CMU_ARCTIC SPEET Synthesis 데이터베이스DATA 소심한 음향 연속 음성 코퍼스 WIKI 단어 임베딩TOOLKIT 세균 : Word2vecTOOLKIT FastTextTOOLKIT 장갑 : 단어 표현을위한 글로벌 벡터INFOPROJECTPROJECTPROJECT Polyglot : 다국어 NLP에 대한 분산 단어 표현PROJECT BPEMB : 275 개 언어의 미리 훈련 된 하위 단어 삽입 컬렉션CHALLENGE 10 차별적 속성 캡처PAPER 언어 단어 임베딩PAPER 교차 언급 모델에 대한 조사 INFO 단어 예측이란 무엇입니까?PAPER 재발 성 신경망 언어 모델을 기반으로하는 문자 예측PAPER 내장 된 딥 러닝 기반 단어 예측PAPER 평가 단어 예측 : 프레임 키 스트로크 저축DATA 임베디드 딥 러닝 기반 단어 예측PROJECT 단어 예측 - iPhone ™ 키보드보다 더 잘할 수 있습니까?CHALLENGE -2018 작업 2, 다국어 이모티콘 예측 WIKI 단어 세분화PAPER 신경 단어 세분화 학습PROJECT 컨볼 루션 신경 네트워크TOOLKIT Stanford Word SegmenterTOOLKIT NLTK 토큰 화제 DATA 단어 감각 명확성PAPER 열차-O-MATIC : 대규모 감독 단어 감각 수동 교육 데이터없이 여러 언어로의 명확성DATA 트레이닝-O- 마틱 데이터DATA babelnet