nlp_tasks 다운로드 nlp_tasks 소스 코드 다운로드

nlp_tasks

기타 소스코드

1.0.0

다운로드

자연어 처리 작업 및 선택된 참조

나는 오랫동안 여러 자연어 처리 작업을 수행 해 왔습니다. 어느 날, 나는 생계를 유지하는 NLP 필드의지도를 그리는 것을 느꼈습니다. 나는 어떤 작업이 NLP에 있는지보고 싶어하는 유일한 사람이 아니라고 확신합니다.

나는 NLP에서 가능한 많은 작업을 다루기 위해 최선을 다했지만, 이것은 지식이 부족하기 때문에 전적으로 철저한 것과는 거리가 멀었습니다. 선택된 참조는 최근의 딥 러닝 성과에 편향되어 있습니다. 나는 당신이 작업을 파헤칠 때 이것이 시작점 역할을 할 것으로 기대합니다. 이 저장소를 직접 업데이트하겠습니다. 그러나 내가 정말로 희망하는 것은이 작품에 대해 협력하는 것입니다. 주저하지 말고 풀 요청을 보내주세요!

2017 년 10 월 13 일.
Kyubyong에 의해

2017 년 10 월 18 일에 YJ Choe가 검토 및 업데이트했습니다.

아나 포라 해상도

Correference 해상도를 참조하십시오

자동 에세이 스코어링

신경망을 사용한 PAPER 자동 텍스트 점수
PAPER 자동 에세이 스코어링에 대한 신경 접근
CHALLENGE Kaggle : Hewlett Foundation : 자동 에세이 스코어링
PROJECT 편의 (향상된 AI 스코어링 엔진)

자동 음성 인식

WIKI 음성 인식
PAPER Deep Speech 2 : 영어 및 만다린의 엔드 투 엔드 음성 인식
PAPER wavenet : 원시 오디오를위한 생성 모델
Baidu의 Deepspeech 아키텍처의 텐서 플로 구현을 PROJECT
PROJECT 연설-텍스트 -wavenet : DeepMind 's Wavenet을 사용한 엔드 대 엔지스 수준 영어 음성 인식
5 번째 차임 연설 분리 및 인식 도전 CHALLENGE
DATA 5 번째 차임 연설 분리 및 인식 도전
DATA CSTR VCTK 코퍼스
DATA librispeech ASR 코퍼스
DATA 전환 보드 -1 전화 연설 코퍼스
DATA TED-LIUM 코퍼스
DATA 공개 음성 및 언어 리소스
DATA 공통 음성

자동 요약

WIKI 자동 요약
자동 텍스트 요약을 BOOK
신경망을 사용한 PAPER 텍스트 요약
재귀 신경 네트워크 및 다중 문서 요약에 대한 응용 프로그램을 사용한 PAPER 순위
DATA 텍스트 분석 컨퍼런스 (TAC)
DATA 문서 컨퍼런스 이해 (DUC)

코퍼레이션 해상도

INFO 혼합 해상도
언급 순위의 코퍼레이션 모델을위한 PAPER 깊은 강화 학습
학습 엔티티 수준 분산 표현에 의한 PAPER 회의 해상도 개선 용지
CHALLENGE Conll 2012 공유 작업 : Ontonotes의 다국어 무제한 혼합 모델링
CHALLENGE 2011 공유 작업 : Ontonotes의 무제한 코퍼레이션 모델링
CHALLENGE Semeval 2018 작업 4 : 다자 대화에 대한 문자 식별

엔티티 링크

명명 된 엔티티 명단을 참조하십시오

문법 오류 수정

PAPER 문법 오류 수정을위한 다층 컨볼 루션 인코더 디코더 신경망
문법 오류 수정을위한 PAPER 신경망 번역 모델
문장 수정을위한 PAPER 적응 시퀀스 모델
CHALLENGE -2013 공유 작업 : 문법 오류 수정
CHALLENGE -2014 공유 작업 : 문법 오류 수정
DATA NUS 비상업적 연구/시험 코퍼스 라이센스
DATA lang-8 학습자 Corpora
DATA 코넬 영화-디 알로그 코퍼스
깊은 텍스트 수정자를 PROJECT
PRODUCT 깊은 문법

음소 전환으로의 그래프

(거의) 모든 언어에 대한 PAPER grapheme-to-phoneme 모델
PAPER Polyglot Neural Language Models : 문구 간 발음 학습의 사례 연구
그래프-프로 넷 전환을위한 PAPER 멀티 태스킹 시퀀스-시퀀스 모델
PROJECT 시퀀스-시퀀스 G2P 툴킷
PROJECT G2P_EN : 영어 Grapheme to Phoneme 변환을위한 간단한 파이썬 모듈
DATA 다국어 발음 데이터

유머와 풍자 탐지

PAPER 자동 풍자 탐지 : 조사
풍자 PAPER 종이 자석 : 풍자적 탐지를 적시에, 상황에 맞는, 매우 개인적으로 만드는
트위터의 PAPER 풍자 탐지 : 행동 모델링 접근법
CHALLENGE Semeval-2017 과제 6 : #hashtagwars : 유머 감각 학습
CHALLENGE Semeval-2017 과제 7 : 영어 말장난의 탐지 및 해석
Reddit의 DATA 냉담한 의견
DATA Sarcasm Corpus v2
DATA 풍자 아마존은 코퍼스를 검토합니다

언어 접지

WIKI 기호 접지 문제
기호 접지 문제를 PAPER
음소에서 이미지까지의 PAPER : 시각적으로 지하면 언어 학습의 반복적 인 신경 모델에서의 표현 수준
기반 연설의 반복적 인 신경 모델에서 음운학의 PAPER 인코딩
작업 중심 언어 접지를위한 PAPER 게이트-입장 아키텍처
PAPER Sound-Word2Vec : 소리에 기초한 단어 표현을 배우는 학습
비전과 통제에 대한 COURSE 언어 근거
로봇 공학에 대한 WORKSHOP 언어 접지

언어 추측

언어 식별을 참조하십시오

언어 식별

WIKI 어 식별
심층 신경망을 사용한 PAPER 자동 언어 식별
작은 피드 포워드 네트워크를 사용한 PAPER 자연어 처리
CHALLENGE 2015 언어 인식 평가

언어 모델링

WIKI 어 모델
TOOLKIT Kenlm 언어 모델 툴킷
단어와 문구의 PAPER 분산 표현 및 구성 성
재발 성 신경망을 가진 PAPER 생성 서열
PAPER 특성 인식 신경 언어 모델
신경망을 기반으로 한 THESIS 통계 언어 모델
DATA 펜 트리 뱅크
재발 신경 네트워크를 사용한 언어 모델링에 대한 TUTORIAL 텐서 플로우 자습서

언어 인식

언어 식별을 참조하십시오

lemmatisation

WIKI 레마 화
PAPER 관절 lemmatization 및 lemming을 사용한 형태 학적 태깅
TOOLKIT Wordnet Lemmatizer
DATA 트리 뱅크 -3

입술 읽기

WIKI 립 독서
PAPER Lipnet : 엔드 투 엔도 문장 수준의 립 리딩
야생 PAPER 종이 립 독서 문장
PAPER 대규모 시각적 음성 인식
PROJECT 립 독서 - 3D 컨볼 루션 신경망을 사용한 교차 시청각 인식
PRODUCT liopa
DATA 그리드 시청각 문장 코퍼스를 데이터
DATA BBC-Oxford '다중 뷰 립 독서 문장'(MV-LRS) 데이터 세트

기계 번역

공동으로 정렬하고 번역하는 법을 배우는 PAPER 신경 기계 번역
선형 시간에 PAPER 신경 기계 번역
PAPER 관심 만 있으면됩니다
신경 기계 번역에 대한 6 가지 PAPER
PAPER 구절 기반 및 신경 비 감독 기계 번역
통계 기계 번역에 대한 ACL 2014 아홉 번째 워크숍에 CHALLENGE
CHALLENGE EMNLP 2017 기계 번역에 관한 두 번째 회의 (WMT17)
DATA 오프 티틀2016
DATA WIT3 : 전사 및 번역 된 대화의 웹 인벤토리
DATA QCRI 교육 도메인 (QED) 코퍼스
서열 학습에 대한 PAPER 멀티 태스크 시퀀스
서열 학습에 대한 서열을위한 PAPER 비 감독 사전 조정
PAPER Google의 다국어 신경 기계 번역 시스템 : 제로 샷 번역 활성화
바이트 쌍 인코딩 (BPE)이있는 TOOLKIT 서브 워드 신경 기계 번역
TOOLKIT 다중 웨이 신경 기계 번역
TOOLKIT OpenNMT : 신경 기계 번역을위한 오픈 소스 툴킷

형태 학적 변곡 생성

WIKI 변곡
서열 학습에 특성 순서를 사용한 PAPER 형태 학적 변곡 생성
Sigmorphon 2016 공유 작업 : 형태 학적 CHALLENGE
DATA sigmorphon2016

지명 된 엔티티 명백

WIKI 엔터티 링크
PAPER 강력하고 집단적 실체는 의미 론적 임베딩을 통한 명확성

지명 된 엔티티 인식

WIKI 라는 이름의 엔티티 인식
명명 된 엔티티 인식을위한 PAPER 신경 아키텍처
PROJECT OSU 트위터 NLP 도구
트위터에서 엔티티 인식이라는 CHALLENGE
CHALLENGE 2002 언어 독립적 인 이름 지정된 엔티티 인식
Conll-2003 공유 작업에 대한 도전 CHALLENGE : 언어 독립적 인 이름 지정된 엔티티 인식
DATA conll-2002 ner corpus
DATA conll-2003 ner corpus
Twitter 공유 작업에서 엔티티 인식이라는 DATA 너트
TOOLKIT Stanford는 Entity Celloizer를 지명했습니다

역설 탐지

PAPER 인 풀링 및 펼쳐지는 반복적 인자가 인코더를 역 동작 탐지를위한
PROJECT Paralex : 공개 질문 답변에 대한 Paraphrase-Driven 학습
CHALLENGE SEMEVAL-2015 과제 1 : 트위터의 역설 및 의미 론적 유사성
DATA Microsoft Research Paraphrase Corpus
DATA 마이크로 소프트 연구 비디오 설명 코퍼스
DATA 파스칼 데이터 세트
DATA 플리커 데이터 세트
아픈 데이터 세트를 DATA
DATA PPDB : Paraphrase 데이터베이스
DATA Wikianswers Paraphrase Corpus

역할 생성

쌓인 잔류 LSTM 네트워크를 사용한 PAPER 신경구 생성
저축 된 잔류 LSTM 네트워크를 사용한 DATA 신경 역사 생성
쌓인 잔차 LSTM 네트워크를 사용하여 신경구 생성을 CODE
PAPER 역할 생성을위한 깊은 생성 프레임 워크
신경 기계 번역으로 재검토 된 PAPER 역설

구문 분석

WIKI 파싱
TOOLKIT Stanford 파서 : 통계 파서
TOOLKIT 스파이 파서
외국어로서 PAPER 문법
신경망을 사용한 빠르고 정확한 의존성 PAPER
PAPER 보편적 시맨틱 파싱
CHALLENGE 2017 공유 작업 : 원시 텍스트에서 보편적 의존성까지 다국어 구문 분석
CHALLENGE 2016 공유 작업 : 다국어 얕은 담론 구문 분석
CHALLENGE 2015 공유 과제 : 얕은 담론 구문 분석
CHALLENGE Semeval-2016 과제 8 : 의미 표현은 추상적 일 수 있지만이 작업은 구체적입니다!

부품 태깅

WIKI 부품 연설 태그
양방향 장거리 단기 메모리 모델 및 보조 손실을 가진 PAPER 다국어 부품 태그
앵커 숨겨진 Markov 모델을 사용한 PAPER 되지 않은 부분-연설 태그
DATA 트리 뱅크 -3
TOOLKIT nltk.tag 패키지

Pinyin-to-Chinese 개종

WIKI Pinyin 입력 방법
중국 Pinyin 입력 방법 엔진 용 PAPER 신경망 언어 모델
PROJECT 신경 중국 경로자

질문 대답

WIKI 질문 응답
PAPER 에게 묻습니다 : 자연어 처리를위한 동적 메모리 네트워크
시각적 및 텍스트 질문 답변을위한 PAPER 동적 메모리 네트워크
TREC 질문 응답 과제 CHALLENGE
CHALLENGE NTCIR-8 : ACLIA (Advanced Cross-LINGUAL 정보 액세스)
CHALLENGE 질문에 도전하십시오
SEMEVAL-2017 CHALLENGE 작업 3 : 커뮤니티 질문 답변
SEMEVAL-2018에 CHALLENGE 과제 11 : 상식 지식을 사용한 기계 이해력
DATA MS Marco : Microsoft Machine 읽기 포괄적 인 데이터 세트
DATA Maluuba Newsqa
DATA 분대 : 텍스트의 기계 이해력에 대한 10 만 개 이상의 질문
DATA 그래프 퀘스트 : 특징이 풍부한 질문 답변 데이터 세트
DATA 스토리 클로즈 테스트 및 Rocstories Corpora
DATA Microsoft Research Wikiqa Corpus
DATA 심해 Q & A 데이터 세트
DATA Qasent
DATA 교과서 질문 답변

관계 추출

WIKI 관계 추출
PAPER 사회 제조 패러다임에서 상호 작용 맥락에서 관계 추출을위한 딥 러닝 접근법
CHALLENGE SEMEVAL-2018 과제 7 과학 논문에서의 의미 론적 관계 추출 및 분류

시맨틱 역할 라벨링

WIKI 시맨틱 역할 라벨링
시맨틱 역할 라벨링을 BOOK
PAPER 신경 네트워크를 이용한 의미 론적 역할 라벨링의 종이 종료 간 학습
종속성 경로 임베딩을 갖는 PAPER 신경 시맨틱 역할 라벨링
PAPER 깊은 의미 론적 역할 라벨링 : 작동하는 것과 다음의 것
CHALLENGE -2005 공유 작업 : 시맨틱 역할 라벨링
CHALLENGE -2004 공유 작업 : 시맨틱 역할 라벨링
TOOLKIT 일리노이 의미 론적 역할 레이더 (SRL)
DATA Conll-2005 공유 작업 : 시맨틱 역할 라벨링

문장 경계 명확성

WIKI 문장 경계 명확성
PAPER 임상 영역에 대한 문장 경계 탐지의 정량적 및 질적 평가
TOOLKIT NLTK 토큰 화제
DATA 영국 국립 코퍼스
DATA 전환 보드 -1 전화 연설 코퍼스

감정 분석

WIKI 감정 분석
INFO 굉장한 감정 분석
CHALLENGE Kaggle : Umich SI650- 감정 분류
SEMEVAL-2017 CHALLENGE 과제 4 : 트위터의 감정 분석
CHALLENGE SEMEVAL-2017 과제 5 : 금융 마이크로 블로그 및 뉴스에 대한 세밀한 감정 분석
PROJECT Senticnet
PROJECT 스탠포드 NLP 그룹 감정 분석
DATA 다중 도메인 감정 데이터 세트 (버전 2.0)
DATA 스탠포드 감정 트리 뱅크
DATA 트위터 감정 코퍼스
DATA 트위터 감정 분석 교육 코퍼스
DATA afinn : 원자가에 대한 영어 단어 목록

수화 인식/번역

시간적 세분화가없는 종이 PAPER 기반 수화 인식
PAPER 서브 유닛 : 엔드 투 엔드 핸드 모양 및 연속 수화 인식
DATA RWTH-PHOENIX-WHEATHER
DATA asllrp
PROJECT 서명

노래하는 음성 합성

깊은 신경망을 기반으로 PAPER 노래 음성 합성
PAPER 신경 파라 메트릭 노래 신디사이저 모델링 음모와 자연 노래의 표현
PRODUCT Vocaloid : Yamaha가 개발 한 음성 합성 기술 및 소프트웨어
CHALLENGE 특별 세션 Interspeech 2016 노래 합성 챌린지 "갭 필인"

사회 과학 응용

WORKSHOP NLP+CSS : 자연 언어 처리 및 계산 사회 과학에 관한 워크샵
TOOLKIT 남성도 쇼핑을 좋아합니다 : 코퍼스 수준의 제약을 사용하여 성 편견 증폭 감소
잠재적 인 Dirichlet 할당을위한 TOOLKIT 온라인 변형 베이 (LDA)
시카고 대학교 지식 연구소 GROUP

소스 분리

WIKI 소스 분리
블라인드에서 안내 된 오디오 소스 분리 PAPER
모노 소스 분리를위한 마스크 및 깊은 재발 신경 네트워크의 PAPER 관절 최적화
CHALLENGE 신호 분리 평가 캠페인 (SISEC)
차임 연설 분리 및 인식 도전에 도전 CHALLENGE

스피커 인증

스피커 확인을 참조하십시오

스피커 참기

WIKI 스피커 참기
스피커 참조를위한 PAPER DNN 기반 스피커 클러스터링
스피커 투기를위한 PAPER 되지 않은 용지 : 통합 및 반복적 접근
시공간 베이지안 융합을 기반으로 PAPER 시청각 스피커 발기
풍부한 전사 평가에 CHALLENGE

스피커 인식

WIKI 스피커 인식
신문 인식 깊은 신경망을 사용한 화자 인식을위한 PAPER 계획
작은 발자국 텍스트 의존 스피커 검증을위한 PAPER 깊은 신경망
PAPER Deep Speaker : 엔드 투 엔드 신경 화자 임베딩 시스템
PROJECT Voice Vector : 할리우드 스타 중 어느 것이 내 목소리와 가장 유사합니까?
CHALLENGE NIST 스피커 인식 평가 (SRE)
INFO 스피커 인식을위한 무료 데이터베이스에 대한 제안이 있습니까?
DATA VoxcelEB2 : 깊은 스피커 인식

연설 읽기

입술 읽기를 참조하십시오

음성 인식

자동 음성 인식을 참조하십시오

음성 세분화

WIKI Speech_Segmentation
8 개월 된 종이 세분화 : PAPER 신호가 통계보다 더 많이 계산할 때
음향 단어 임베딩을 사용한 PAPER 비 감독 단어 세분화 및 어휘 발견
음향 입력으로 인한 PAPER 비 감독 사전 발견
PAPER 상호 언어 측면 정보를 사용하여 약하게 감독 된 구어체 발견
DATA 콜 홈 스페인어 연설

음성 합성

WIKI 연설 합성
Mel Spectrogram 예측에 컨디셔닝 Wavenet에 의한 PAPER 자연 TTS 합성
PAPER wavenet : 원시 오디오를위한 생성 모델
PAPER 타코트론 : 엔드 투 엔드 언어 합성을 향해
PAPER 깊은 음성 3 : 2000 스피커 신경 텍스트 음주
종이가 안내 된 깊은 컨볼 루션 네트워크를 기반으로하는 PAPER 효율적으로 훈련 가능한 텍스트 음성 음성 시스템
세계 영어 성경 DATA
DATA LJ 음성 데이터 세트
DATA 적은 데이터
CHALLENGE 블리자드 챌린지 2017
PRODUCT Lyrrebird
Festvox 프로젝트를 PROJECT
TOOLKIT 멀린 : 신경망 (NN) 기반 음성 합성 시스템

언어 향상

WIKI 연설 향상
BOOK 연설 향상 : 이론과 실습
PAPER 언어 향상에 대한 실험적 연구를 기반으로합니다
논문 연설 향상에 대한 회귀 접근법을 기반으로 한 Epepneuralnetworks를 기반으로 PAPER
깊은 비노 이는 자동 인코더를 기반으로 PAPER 음성 향상

음성-텍스트

자동 음성 인식을 참조하십시오

음성 용어 탐지

음성 세분화를 참조하십시오

스템 밍

WIKI 스템 밍
PAPER 아라비아 스템 밍을 개선하기위한 역전 신경망
TOOLKIT nltk stemmers

용어 추출

WIKI 용어 추출
서열 분류를위한 PAPER 신경주의 모델 : 주요 용어 추출 및 대화 행위 탐지에 대한 분석 및 적용

텍스트 유사성

WIKI 시맨틱 유사성
PAPER 텍스트 유사성 접근법에 대한 조사
컨볼 루션 깊은 신경 네트워크로 짧은 텍스트 쌍 순위 순위를 매기는 PAPER 학습
종이가 PAPER 구조화 된 긴 단기 메모리 네트워크에서 시맨틱 표현 향상
CHALLENGE Semeval-2014 과제 3 : 교차 수준의 의미 론적 유사성
CHALLENGE -2014 TASK 10 : 다국어 시맨틱 텍스트 유사성
SEMEVAL-2017 과제 CHALLENGE 과제 1 : 시맨틱 텍스트 유사성
WIKI 시맨틱 텍스트 유사성 위키

텍스트 단순화

WIKI 텍스트 단순화
표준 위키 백과에서 간단한 위키 백과에 이르기까지 문장을 PAPER 합니다
현재 텍스트 단순화 연구의 PAPER 문제 : 새로운 데이터가 도움이 될 수 있습니다.
DATA 뉴 셀라 데이터

텍스트 음성

음성 합성을 참조하십시오

텍스트 수입

WIKI 텍스트 수입
Tensorflow와 함께 PROJECT 텍스트 수반
구조화 된 관심과 구성을 가진 PAPER 텍스트 수반
CHALLENGE SEMEVAL-2014 과제 1 : 의미 론적 관련성 및 텍스트 entailment를 통해 전체 문장에 대한 구성 분포 의미 론적 모델 평가
CHALLENGE SEMEVAL-2013 과제 7 : 공동 학생 응답 분석 및 8 번째 인식 텍스트 수입 도전

음역

WIKI 경로
비 라틴 스크립트의 INFO 음역
PAPER 기계 음역에 대한 딥 러닝 접근
CHALLENGE 뉴스 2016 지명 된 엔티티의 음역에 대한 공유 작업
PROJECT 신경 일본 음역 - Swiftkey ™ 키보드보다 더 잘할 수 있습니까?

음성 변환

병렬 데이터 훈련없이 다중 하나의 음성 변환을위한 PAPER 음성 사후 그램
Tensorflow에서 음성 변환 (음성 스타일 전송)을위한 깊은 신경망을 PROJECT
음성 사후 그램을 사용하여 음성 변환 시스템 구현을 PROJECT
CHALLENGE 음성 변환 챌린지 2016
CHALLENGE 음성 변환 챌린지 2018
DATA CMU_ARCTIC SPEET Synthesis 데이터베이스
DATA 소심한 음향 연속 음성 코퍼스

음성 인식

스피커 인식을 참조하십시오

단어 임베딩

WIKI 단어 임베딩
TOOLKIT 세균 : Word2vec
TOOLKIT FastText
TOOLKIT 장갑 : 단어 표현을위한 글로벌 벡터
사전 준비된 모델을 얻을 수있는 INFO
미리 훈련 된 단어 벡터를 PROJECT
30 개 이상의 언어의 미리 훈련 된 단어 벡터를 PROJECT
PROJECT Polyglot : 다국어 NLP에 대한 분산 단어 표현
PROJECT BPEMB : 275 개 언어의 미리 훈련 된 하위 단어 삽입 컬렉션
Semeval 2018 CHALLENGE 10 차별적 속성 캡처
문구 기반 기계 번역을위한 종이 PAPER 언어 단어 임베딩
PAPER 교차 언급 모델에 대한 조사

단어 예측

INFO 단어 예측이란 무엇입니까?
PAPER 재발 성 신경망 언어 모델을 기반으로하는 문자 예측
PAPER 내장 된 딥 러닝 기반 단어 예측
PAPER 평가 단어 예측 : 프레임 키 스트로크 저축
DATA 임베디드 딥 러닝 기반 단어 예측
Convolutional Neural Networks를 사용한 PROJECT 단어 예측 - iPhone ™ 키보드보다 더 잘할 수 있습니까?
CHALLENGE -2018 작업 2, 다국어 이모티콘 예측

단어 세분화

WIKI 단어 세분화
중국어를위한 PAPER 신경 단어 세분화 학습
중국어 단어 세분화를위한 PROJECT 컨볼 루션 신경 네트워크
TOOLKIT Stanford Word Segmenter
TOOLKIT NLTK 토큰 화제

단어 감각 분해

DATA 단어 감각 명확성
PAPER 열차-O-MATIC : 대규모 감독 단어 감각 수동 교육 데이터없이 여러 언어로의 명확성
DATA 트레이닝-O- 마틱 데이터
DATA babelnet

확장하다

추가 정보

버전 1.0.0
유형 기타 소스코드
업데이트 시간 2025-04-16
크기 16.63KB
출처 Github