Pertanyaan luar biasa menjawab
Daftar pertanyaan yang dikuratori dari subjek menjawab pertanyaan (QA) yang merupakan disiplin ilmu komputer dalam bidang pengambilan informasi dan pemrosesan bahasa alami (NLP) untuk menggunakan pembelajaran mesin dan pembelajaran yang mendalam
정보검색및자연언어처리분아야의질의응답에관한큐레이션- 머신러닝과딥러닝단계까지
Daftar topik sistem tanya jawab yang dipilih, disiplin ilmu komputer di bidang pengambilan informasi dan pemrosesan bahasa alami - menggunakan pembelajaran mesin dan pembelajaran yang mendalam
Isi
- Tren terbaru
- Tentang QA
- Acara
- Sistem
- Kompetisi di QA
- Publikasi
- Kode
- Ceramah
- Slide
- Koleksi Dataset
- Kumpulan data
- Buku
- Tautan
Tren terbaru
Model QA terbaru
- Dilbert: Menunda Lapisan Interaksi dalam Encoder Berbasis Transformer Untuk Jawaban Domain Terbuka yang Efisien (2020)
- Kertas: https://arxiv.org/pdf/2010.08422.pdf
- GitHub: https://github.com/wissam-sib/dilbert
- UnifiedQA: Batas format persimpangan dengan sistem QA tunggal (2020)
- Demo: https://unifiedqa.apps.allenai.org/
- ProQA: Metode hemat sumber daya untuk pretraining indeks corpus padat untuk QA dan IR domain terbuka. (2020)
- Kertas: https://arxiv.org/pdf/2005.00038.pdf
- Github: https://github.com/xwhan/proqa
- Tydi QA: Benchmark untuk pertanyaan mencari informasi yang menjawab dalam bahasa yang beragam secara tipologis (2020)
- Kertas: https://arxiv.org/ftp/arxiv/papers/2003/2003.05002.pdf
- Pembaca retrospektif untuk pemahaman membaca mesin
- Kertas: https://arxiv.org/pdf/2001.09694v2.pdf
- TANDA: Transfer dan beradaptasi model transformator pra-terlatih untuk pemilihan kalimat jawaban (AAAI 2020)
- Kertas: https://arxiv.org/pdf/1911.04118.pdf
Model bahasa terbaru
- Electra: Encoder teks pra-pelatihan sebagai diskriminator daripada generator, Kevin Clark, et al., ICLR, 2020.
- Tinybert: Distilling Bert untuk pemahaman bahasa alami, Xiaoqi Jiao, et al., Iclr, 2020.
- Minilm: Distilasi perhatian diri yang mendalam untuk kompresi tugas-agnostik transformer pra-terlatih, Wenhui Wang, et al., Arxiv, 2020.
- T5: Menjelajahi batasan pembelajaran transfer dengan transformator teks-ke-teks terpadu, Colin Raffel, et al., Arxiv Preprint, 2019.
- Ernie: Representasi bahasa yang ditingkatkan dengan entitas informatif, Zhengyan Zhang, et al., ACL, 2019.
- XLNET: pretraining autoregresif umum untuk pemahaman bahasa, Zhilin Yang, et al., Arxiv Preprint, 2019.
- Albert: Lite Bert untuk pembelajaran representasi bahasa sendiri, Zhenzhong Lan, et al., Arxiv Preprint, 2019.
- Roberta: Pendekatan pretraining Bert yang dioptimalkan dengan kuat, Yinhan Liu, et al., Arxiv Preprint, 2019.
- Distilbert, versi Bert: lebih kecil, lebih cepat, lebih murah dan lebih ringan, Victor Sanh, et al., Arxiv, 2019.
- Spanbert: Meningkatkan pra-pelatihan dengan mewakili dan memprediksi bentang, Mandar Joshi, et al., TACL, 2019.
- Bert: Pra-pelatihan transformator dua arah yang dalam untuk pemahaman bahasa, Jacob Devlin, et al., NAACL 2019, 2018.
Aaai 2020
- TANDA: Transfer dan beradaptasi model transformator pra-terlatih untuk pemilihan kalimat jawaban, Siddhant Garg, et al., AAAI 2020, Nov 2019.
ACL 2019
- Tinjauan Tugas Bersama Mediqa 2019 pada inferensi tekstual, hiburan pertanyaan dan menjawab pertanyaan, Asma Ben Abacha, et al., ACL-W 2019, Agustus 2019.
- Menuju jaringan kapsul yang dapat diskalakan dan andal untuk aplikasi NLP yang menantang, Wei Zhao, et al., ACL 2019, Juni 2019.
- Grafik kognitif untuk pemahaman membaca multi-hop pada skala, Ming Ding, et al., ACL 2019, Juni 2019.
- Pertanyaan domain terbuka real-time yang menjawab dengan indeks frase-tingkat padat, Minjoon SEO, et al., ACL 2019, Juni 2019.
- Pertanyaan tanpa pengawasan yang dijawab oleh Cloze Translation, Patrick Lewis, et al., ACL 2019, Juni 2019.
- SEMEVAL-2019 Tugas 10: Penjawab pertanyaan matematika, Mark Hopkins, et al., ACL-W 2019, Juni 2019.
- Meningkatkan pertanyaan menjawab KBS yang tidak lengkap dengan pembaca sadar pengetahuan, Wenhan Xiong, et al., ACL 2019, Mei 2019.
- Pasang artikel yang cocok dengan dekomposisi dan konvolusi grafis, Bang Liu, et al., ACL 2019, Mei 2019.
- Pembaca Memori Episodik: Mempelajari apa yang harus diingat untuk menjawab pertanyaan dari data streaming, Moonssu Han, et al., ACL 2019, Mar 2019.
- Pertanyaan Alami: Benchmark untuk pertanyaan yang menjawab penelitian, Tom Kwiatkowski, et al., TACL 2019, Jan 2019.
- Pertanyaan Buku Teks Menjawab dengan pemahaman grafik konteks multi-modal dan pemahaman terbuka yang di-swadaya, Daesik Kim, et al., ACL 2019, Nov 2018.
EMNLP-IJCNLP 2019
- Model Bahasa sebagai Basis Pengetahuan?, Fabio Petron, et al., EMNLP-IJCNLP 2019, Sep 2019.
- LXMERT: Mempelajari representasi encoder lintas-modalitas dari Transformers, Hao Tan, et al., EMNLP-IJCNLP 2019, Des 2019.
- Menjawab pertanyaan domain terbuka yang kompleks melalui generasi kueri iteratif, Peng qi, et al., EMNLP-IJCNLP 2019, Okt 2019.
- Kagnet: Jaringan grafik yang sadar pengetahuan untuk penalaran akal sehat, Bill Yuchen Lin, et al., EMNLP-ijcnlp 2019, Sep 2019.
- Pilihan konten campuran untuk generasi urutan beragam, Jaemin Cho, et al., EMNLP-IJCNLP 2019, Sep 2019.
- Pendekatan EM keras diskrit untuk menjawab pertanyaan yang diawasi dengan lemah, Sewon Min, et al., EMNLP-ijcnlp, 2019, Sep 2019.
Arxiv
- Menyelidiki keberhasilan dan kegagalan Bert untuk peringkat kembali, Harshith Padigela, et al., ARXIV Preprint, Mei 2019.
- Bert with History Answer Embedding untuk menjawab pertanyaan percakapan, Chen Qu, et al., Arxiv Preprint, Mei 2019.
- Memahami perilaku Bert dalam peringkat, Yifan Qiao, et al., Arxiv Preprint, Apr 2019.
- Bert pasca-pelatihan untuk pemahaman bacaan ulasan dan analisis sentimen berbasis aspek, Hu Xu, et al., Arxiv Preprint, Apr 2019.
- Pertanyaan domain terbuka ujung ke ujung menjawab dengan Bertserini, Wei Yang, dkk., Arxiv Preprint, Feb 2019.
- Baseline Bert untuk Pertanyaan Alami, Chris Alberti, et al., ARXIV Pracrint, Jan 2019.
- Passage-ranking dengan Bert, Rodrigo Nogueira, dkk., ARXIV Preprint, Jan 2019.
- SDNET: Jaringan mendalam berbasis perhatian kontekstual untuk menjawab pertanyaan percakapan, Cheng Zhu, et al., Arxiv, Des 2018.
Dataset
- ELI5: Penjawaban Pertanyaan Bentuk Panjang, Angela Fan, et al., ACL 2019, Jul 2019
- Codah: Sebuah pertanyaan yang ditulis secara bermanfaat menjawab dataset untuk akal sehat, Michael Chen, et al., Repeval 2019, Jun 2019.
Tentang QA
Jenis QA
- Single-Turn QA: Jawab tanpa mempertimbangkan konteks apa pun
- QA percakapan: Gunakan belokan percakapan sebelumnya
Subtipe QA
- QA berbasis pengetahuan
- QA Berbasis Tabel/Daftar
- QA berbasis teks
- QA berbasis komunitas
- QA visual
Analisis dan penguraian untuk pra-pemrosesan dalam sistem QA
Analisis Lanugage
- Analisis morfologis
- Named Entity Recognition (NER)
- Analisis Homonim / Polisemia
- Parsing sintaksis (parsing ketergantungan)
- Pengakuan semantik
Sebagian besar sistem QA memiliki sekitar 3 bagian
- Ekstraksi fakta
- Ekstraksi entitas
- Named-entity Recognition (NER)
- Ekstraksi relasi
- Memahami pertanyaannya
- Menghasilkan jawaban
Acara
- Wolfram Alpha menggantung mesin jawaban pada tahun 2009.
- IBM Watson System mengalahkan Jeopardy Top! Juara di tahun 2011.
- Mesin jawaban Wolfram Alpha yang terintegrasi Siri Apple pada tahun 2011.
- Google tertanam QA dengan meluncurkan grafik pengetahuannya, memanfaatkan basis pengetahuan dasar gratis pada tahun 2012.
- Amazon Echo | Alexa (2015), Google Home | Google Assistant (2016), Invoke | MS Cortana (2017), Homepod (2017)
Sistem
- IBM Watson-memiliki kinerja canggih.
- Facebook DRQA - Diterapkan ke Dataset Skuad1.0. Dataset Skuad2.0 telah dirilis. Tapi DRQA belum diuji.
- Grafik Pengetahuan MIT Media Lab - adalah jaringan semantik yang tersedia secara bebas, dirancang untuk membantu komputer memahami makna kata -kata yang digunakan orang.
Kompetisi di QA
| Dataset | Bahasa | Penyelenggara | Sejak | Peringkat teratas | Model | Status | Lebih dari kinerja manusia |
|---|
| 0 | Tes Cloze Story | Bahasa inggris | Univ. dari Rochester | 2016 | msap | Regresi logistik | Tertutup | X |
| 1 | Ms Marco | Bahasa inggris | Microsoft | 2016 | Yuanfudao Research NLP | MARS | Tertutup | Hai |
| 2 | Ms Marco v2 | Bahasa inggris | Microsoft | 2018 | NTT Media Intelli. Laboratorium. | Gaya tanya jawab masque | Dibuka | X |
| 3 | Pasukan | Bahasa inggris | Univ. dari Stanford | 2018 | Xlnet (model tunggal) | Tim XLNET | Tertutup | Hai |
| 4 | Skuad 2.0 | Bahasa inggris | Univ. dari Stanford | 2018 | Pingan Omni-Sinitic | Albert + DAAF + Verifier (Ensemble) | Dibuka | Hai |
| 5 | Triviaqa | Bahasa inggris | Univ. dari Washington | 2017 | Ming Yan | - | Tertutup | - |
| 6 | decanlp | Bahasa inggris | Penelitian Salesforce | 2018 | Penelitian Salesforce | Mqan | Tertutup | X |
| 7 | Dureader ver1. | Cina | Baidu | 2015 | Tryer | T-reader (tunggal) | Tertutup | X |
| 8 | Dureader ver2. | Cina | Baidu | 2017 | Renaisans | Alireader | Dibuka | - |
| 9 | Korquad | Korea | Penelitian LG CNS AI | 2018 | Tim Larva Clova Ai | Larva-Kor-Large + + Claf (tunggal) | Tertutup | Hai |
| 10 | Korquad 2.0 | Korea | Penelitian LG CNS AI | 2019 | Universitas Nasional Kangwon | Knu-baseline (model tunggal) | Dibuka | X |
| 11 | Coqa | Bahasa inggris | Univ. dari Stanford | 2018 | Teknologi Zhuiyi | Roberta + AT + KD (Ensemble) | Dibuka | Hai |
Publikasi
- Dokumen
- "Belajar Skim Teks", Adams Wei Yu, Hongrae Lee, Quoc V. Le, 2017 .: Tunjukkan Hanya Apa yang Anda Inginkan dalam Teks
- "Disambiguasi entitas bersama yang dalam dengan perhatian saraf setempat", Octavian-Eugen Ganea dan Thomas Hofmann, 2017.
- "Aliran perhatian dua arah untuk pemahaman mesin", Minjoon Seo, Aniruddha Kembhavi, Ali Farhadi, Hananneh Hajishirzi, ICLR, 2017.
- "Menangkap kesamaan semantik untuk entitas yang terhubung dengan jaringan saraf konvolusional", Matthew Francis-Landau, Greg Durrett dan Dan Klei, NaaCl-HLT 2016.
- https://github.com/matthewfl/nlp-entity-convnet
- "Entitas yang menghubungkan dengan basis pengetahuan: masalah, teknik, dan solusi", Wei Shen, Jianyong Wang, Jiawei Han, Transaksi IEEE tentang Pengetahuan dan Rekayasa Data (TKDE), 2014.
- "Pengantar" This Is Watson ", Jurnal Penelitian dan Pengembangan IBM, da Ferrucci, 2012.
- "Survei tentang pertanyaan menjawab teknologi dari perspektif pengambilan informasi", Ilmu Informasi, 2011.
- "Pertanyaan yang menjawab di domain terbatas: tinjauan umum", Diego Mollá dan José Luis Vicedo, Computational Linguistics, 2007
- "Jawaban Pertanyaan Bahasa Alami: The View From Here", L Hirschman, R Gaizauskas, Natural Language Engineering, 2001.
- Entitas disambiguasi / entitas menghubungkan
Kode
- BIGAF-Jaringan aliran perhatian dua arah (BIDAF) adalah proses hierarkis multi-tahap yang mewakili konteks pada berbagai tingkat granularitas dan menggunakan mekanisme aliran perhatian dua arah untuk mendapatkan representasi konteks yang sadar-permintaan tanpa ringkasan awal.
- Resmi; Tensorflow v1.2
- Kertas
- QANET-Arsitektur T&J tidak memerlukan jaringan berulang: enkodernya secara eksklusif terdiri dari konvolusi dan perhatian diri, di mana model konvolusi interaksi lokal dan model-model swadaya interaksi global.
- Google; Tidak resmi; Tensorflow v1.5
- Kertas
- R-NET-Model jaringan saraf ujung ke ujung untuk menjawab pertanyaan gaya pemahaman membaca, yang bertujuan untuk menjawab pertanyaan dari bagian yang diberikan.
- MS; Secara tidak resmi oleh hkust; Tensorflow v1.5
- Kertas
- R-NET-IN-BERAS-R-NET Implementation di Keras.
- MS; Tidak resmi; Keras v2.0.6
- Kertas
- DRQA - DRQA adalah sistem untuk pemahaman membaca yang diterapkan untuk menjawab pertanyaan domain terbuka.
- Facebook; Resmi; Pytorch V0.4
- Kertas
- Bert - Model representasi bahasa baru yang merupakan singkatan dari representasi enkoder dua arah dari Transformers. Tidak seperti model representasi bahasa baru-baru ini, Bert dirancang untuk pra-train representasi sepeda dalam dengan mengkondisikan bersama pada konteks kiri dan kanan di semua lapisan.
- Google; Implementasi resmi; TensorFlow v1.11.0
- Kertas
Ceramah
- PERTANYAAN PERTANYAAN - Pemrosesan Bahasa Alami - Oleh Dragomir Radev, Ph.D. | Universitas Michigan | 2016.
Slide
- Pertanyaan menjawab dengan basis pengetahuan, web dan seterusnya - oleh Scott Wen -tau yih & hao ma | Microsoft Research | 2016.
- PERTANYAAN PERTANYAAN - Oleh Dr. Mariana Neves | Hasso Plattner Institut | 2017.
Koleksi Dataset
- Dataset Penjawab Pertanyaan Nliwod
- Dataset KartHinknCode untuk pemrosesan bahasa alami
Kumpulan data
- Pertanyaan Sains AI2 v2.1 (2017)
- Ini terdiri dari pertanyaan yang digunakan dalam penilaian siswa di Amerika Serikat di seluruh tingkat kelas dasar dan sekolah menengah. Setiap pertanyaan adalah format pilihan ganda 4 arah dan mungkin atau mungkin tidak termasuk elemen diagram.
- Kertas: http://ai2-website.s3.amazonaws.com/publications/ai2reasoningchallenge2018.pdf
- Tes buku anak -anak
- Ini adalah salah satu proyek BABI dari Facebook AI Research yang diselenggarakan untuk tujuan pemahaman dan penalaran teks otomatis. CBT dirancang untuk mengukur secara langsung seberapa baik model bahasa dapat mengeksploitasi konteks linguistik yang lebih luas.
- Dataset Codah
- Dataset T&J DeepMind; CNN/Daily Mail
- Hermann et al. (2015) membuat dua kumpulan data yang luar biasa menggunakan artikel berita untuk penelitian tanya jawab. Setiap dataset berisi banyak dokumen (masing -masing 90k dan 197k), dan setiap perusahaan dokumen rata -rata 4 pertanyaan kira -kira. Setiap pertanyaan adalah kalimat dengan satu kata/frasa yang hilang yang dapat ditemukan dari dokumen/konteks yang menyertainya.
- Kertas: https://arxiv.org/abs/1506.03340
- Eli5
- Kertas: https://arxiv.org/abs/1907.09190
- Perjanjian grafik
- Tentang menghasilkan set pertanyaan kaya karakteristik untuk evaluasi QA.
- LC-Quad
- Ini adalah dataset KBQA standar emas (pertanyaan yang menjawab atas basis pengetahuan) yang berisi 5000 pertanyaan dan kueri SPARQL. LC-Quad menggunakan Dbpedia V04.16 sebagai target KB.
- Ms Marco
- Ini untuk menjawab pertanyaan dunia nyata.
- Kertas: https://arxiv.org/abs/1611.09268
- Mulirc
- Set data paragraf pendek dan pertanyaan multi-kalimat
- Kertas: http://cogcomp.org/page/publication_view/833
- Narrativeqa
- Ini termasuk daftar dokumen dengan ringkasan Wikipedia, tautan ke cerita lengkap, dan pertanyaan dan jawaban.
- Kertas: https://arxiv.org/pdf/1712.07040v1.pdf
- Newsqa
- Dataset Pemahaman Mesin
- Kertas: https://arxiv.org/pdf/1611.09830.pdf
- Dataset Qestion-Answer oleh CMU
- Ini adalah korpus artikel Wikipedia, pertanyaan factoid yang dihasilkan secara manual dari mereka, dan jawaban yang dihasilkan secara manual untuk pertanyaan-pertanyaan ini, untuk digunakan dalam penelitian akademik. Data ini dikumpulkan oleh Noah Smith, Michael Heilman, Rebecca Hwa, Shay Cohen, Kevin Gimpel, dan banyak mahasiswa di Universitas Carnegie Mellon dan Universitas Pittsburgh antara 2008 dan 2010.
- Skuad1.0
- Stanford Pertanyaan menjawab Dataset (Skuad) adalah dataset pemahaman bacaan, yang terdiri dari pertanyaan yang diajukan oleh pekerja kerumunan pada satu set artikel Wikipedia, di mana jawaban untuk setiap pertanyaan adalah segmen teks, atau rentang, dari bagian bacaan yang sesuai, atau pertanyaannya mungkin tidak dapat dijawab.
- Kertas: https://arxiv.org/abs/1606.05250
- Skuad2.0
- Squad2.0 menggabungkan 100.000 pertanyaan dalam skuad1.1 dengan lebih dari 50.000 pertanyaan baru yang tidak dapat dijawab yang ditulis secara bermusuhan oleh pekerja kerumunan untuk terlihat mirip dengan jawaban. Untuk melakukannya dengan baik di Squad2.0, sistem tidak hanya harus menjawab pertanyaan jika memungkinkan, tetapi juga menentukan kapan tidak ada jawaban yang didukung oleh paragraf dan abstain untuk menjawab.
- Kertas: https://arxiv.org/abs/1806.03822
- Tes Cloze Story
- 'Story Cloze Test' adalah kerangka penalaran masuk akal baru untuk mengevaluasi pemahaman cerita, pembuatan cerita, dan pembelajaran naskah. Tes ini membutuhkan sistem untuk memilih akhir yang benar untuk cerita empat kalimat.
- Kertas: https://arxiv.org/abs/1604.01696
- Triviaqa
- Triviaqa adalah dataset pemahaman bacaan yang berisi lebih dari 650 ribu tanya jawab tiga kali lipat tiga. Triviaqa mencakup 95K pasangan tanya jawab yang ditulis oleh para penggemar trivia dan rata-rata mengumpulkan dokumen bukti, enam per pertanyaan, yang memberikan pengawasan jauh berkualitas tinggi untuk menjawab pertanyaan.
- Kertas: https://arxiv.org/abs/1705.03551
- Wikiqa
- Seperangkat pasangan pertanyaan dan kalimat yang tersedia untuk dijawab dengan pertanyaan domain terbuka.
Tim Peneliti DeepQa di publikasi IBM Watson dalam waktu 5 tahun
- 2015
- "Generasi Daftar Masalah Otomatis dari Rekam Medis Elektronik di IBM Watson", Murthy Devarakonda, Ching-Huei Tsou, Iaai, 2015.
- "Pengambilan Keputusan di IBM Watson Pertanyaan Jawaban", J. William Murdock, Ontology Summit, 2015.
- "Analisis hubungan entitas yang tidak diawasi di IBM Watson", Aditya Kalyanpur, J William Murdock, ACS, 2015.
- "Penalaran Advonsense: Pendekatan Berbasis Kalkulus Acara", Et Mueller, Morgan Kaufmann/Elsevier, 2015.
- 2014
- "Ringkasan Catatan Pasien Berorientasi Masalah: Laporan awal tentang aplikasi Watson", M. Devarakonda, Dongyang Zhang, Ching-Huei Tsou, M. Bornea, Healthcom, 2014.
- "Watsonpaths: Pertanyaan Berbasis Skenario Menjawab dan kesimpulan atas informasi yang tidak tersumbat", Adam Lally, Sugato Bachi, Michael A. Barborak, David W. Buchanan, Jennifer Chu-Carroll, David A. Ferrucci*, Michael R. Glass, Aditya Kalyanpur, Erik T. Laporan Penelitian RC25489, 2014.
- "Ekstraksi hubungan medis dengan model manifold", Chang Wang dan James Fan, ACL, 2014.
Publikasi MS Research dalam waktu 5 tahun
- 2018
- "Mengkarakterisasi dan mendukung pertanyaan yang menjawab dalam komunikasi manusia-ke-manusia", Xiao Yang, Ahmed Hassan Awadallah, MADIAN KHABSA, Wei Wang, Miaosen Wang, ACM Sigir, 2018.
- "Figurqa: Dataset angka beranotasi untuk penalaran visual", Samira Ebrahimi Kahou, Vincent Michalski, Adam Atkinson, Akos Kadar, Adam Trischler, Yoshua Bengio, ICLR, 2018
- 2017
- "Jaringan perhatian multi-level untuk menjawab pertanyaan visual", Dongfei Yu, Jianlong Fu, Tao Mei, Yong Rui, CVPR, 2017.
- "Model bersama untuk menjawab pertanyaan dan pembuatan pertanyaan", Tong Wang, Xingdi (Eric) Yuan, Adam Trischler, ICML, 2017.
- "Jaringan sintesis dua tahap untuk pembelajaran transfer dalam pemahaman mesin", David Golub, Po-Sen Huang, Xiaodong HE, Li Deng, EMNLP, 2017.
- "Permintaan pertanyaan dengan representasi yang dapat ditafsirkan secara tata bahasa", Hamid Palangi, Paul Smolensky, Xiaodong He, Li Deng,
- "Pembelajaran saraf berbasis pencarian untuk menjawab pertanyaan berurutan", Mohit Iyyer, Wen-Tau Yih, Ming-Wei Chang, ACL, 2017.
- 2016
- "Jaringan perhatian bertumpuk untuk menjawab pertanyaan gambar", Zichao Yang, Xiaodong He, Jianfeng Gao, Li Deng, Alex Smola, CVPR, 2016.
- "Pertanyaan yang menjawab dengan basis pengetahuan, web, dan seterusnya", Yih, Scott Wen-Tau dan Ma, Hao, Acm Sigir, 2016.
- "Newsqa: Dataset Pemahaman Mesin", Adam Trischler, Tong Wang, Xingdi Yuan, Justin Harris, Alessandro Sordoni, Philip Bachman, Kaheer Suleman, Repl4nlp, 2016.
- "Table Cell Search untuk menjawab pertanyaan", Sun, Huan dan Ma, Hao dan He, Xiaodong dan Yih, Wen-tau dan Su, Yu dan Yan, Xifeng, www, 2016.
- 2015
- "Wikiqa: Dataset tantangan untuk menjawab pertanyaan domain terbuka", Yi Yang, Wen-Tau Yih, dan Christopher Meek, EMNLP, 2015.
- "Jawaban Pertanyaan Berbasis Web: Meninjau kembali AskMSR", Chen-tse Tsai, Wen-Tau Yih, dan Christopher JC Burges, MSR-TR, 2015.
- "Pertanyaan domain terbuka menjawab melalui pengayaan semantik", Huan Sun, Hao MA, Wen-Tau Yih, Chen-Tse Tsai, Jingjing Liu, dan Ming-Wei Chang, www, 2015.
- 2014
- "Tinjauan Sistem QA Microsoft Deep di Stanford Webquestions Benchmark", Zhenghao Wang, Shengquan Yan, Huaming Wang, dan Xuedong Huang, MSR-TR, 2014.
- "Parsing semantik untuk menjawab pertanyaan hubungan tunggal", Wen-tau yih, Xiaodong He, Christopher Meek, ACL, 2014.
Publikasi Google AI dalam waktu 5 tahun
- 2018
- Google QA
- "Qanet: Menggabungkan konvolusi lokal dengan perhatian diri global untuk pemahaman membaca", Adams Wei Yu, David Dohan, Minh-Ther Luong, Rui Zhao, Kai Chen, Mohammad Norouzi, Quoc V. Le, ICLR, 2018.
- "Ajukan pertanyaan yang tepat: reformulasi pertanyaan aktif dengan pembelajaran penguatan", Christian Buck dan Jannis Bulian dan Massimiliano Ciaramita dan Wojciech Paweł Gajewski dan Andrea Gesmundo dan Neil Houlsby dan Wei Wang, ICLR, 2018.
- "Membangun Dataset Komprehensi Bacaan Mesin Besar Menggunakan Vektor Paragraf", Radu Soricut, Nan Ding, 2018.
- Representasi Kalimat
- "Kerangka kerja yang efisien untuk representasi pembelajaran kalimat", Lajanugen Logeswaran, Honglak Lee, ICLR, 2018.
- "Apakah model itu memahami pertanyaannya?", Pramod K. Mudrakarta dan Ankur Taly dan Mukund Sundararajan dan Kedar Dhamdhere, ACL, 2018.
- 2017
- "Menganalisis bahasa yang dipelajari oleh agen penjawab pertanyaan aktif", Christian Buck dan Jannis Bulian dan Massimiliano Ciaramita dan Wojciech Gajewski dan Andrea Gesmundo dan Neil Houlsby dan Wei Wang, Nips, 2017.
- "Belajar representasi rentang berulang untuk menjawab pertanyaan ekstraktif", Kenton Lee dan Shimi Salant dan Tom Kwiatkowski dan Ankur Parikh dan Dipanjan Das dan Jonathan Berant, ICLR, 2017.
- Identifikasi pertanyaan yang sama
- "Identifikasi Paraphrase Saraf Tulisan dengan Pretraining Berisik", Gaurav Singh Tomar dan Thyago Duque dan Oscar Täckström dan Jakob Uszkoreit dan Dipanjan Das, Sclem, 2017.
- 2014
- "Pertanyaan bagus! Kualitas pertanyaan dalam Q&A Komunitas", Sujith Ravi dan Bo Pang dan Vibhor Rastogi dan Ravi Kumar, ICWSM, 2014.
Publikasi Facebook AI Research dalam waktu 5 tahun
- 2018
- Pertanyaan yang Diwujudkan Jawaban, Abhishek Das, Samyak Datta, Georgia Gkioxari, Stefan Lee, Devi Parikh, dan Dhruv Batra, CVPR, 2018
- Apakah penjelasan membuat model VQA lebih dapat diprediksi oleh manusia?, Arjun Chandrasekaran, Viraj Prabhu, Deshraj Yadav, Prithvijit Chattopadhyay, dan Devi Parikh, EMNLP, 2018
- Semantik Denotasional Komposisi Saraf untuk menjawab pertanyaan, Nitish Gupta, Mike Lewis, EMNLP, 2018
- 2017
- Drqa
- Membaca Wikipedia untuk menjawab pertanyaan domain terbuka, Danqi Chen, Adam Fisch, Jason Weston & Antoine Bordes, ACL, 2017.
Buku
- Sistem Penjawab Bahasa Alami Paperback - Boris Galissky (2003)
- Arah baru yang dimaksud menjawab - Mark T. Maybury (2004)
- Bagian 3. 5. Pertanyaan Jawab dalam Buku Pegangan Linguistik Komputasi Oxford - Sanda Harabagiu dan Dan Moldovan (2005)
- Bab.28 Pertanyaan Jawab dalam Pidato dan Pemrosesan Bahasa - Daniel Jurafsky & James H. Martin (2017)
Tautan
- Membangun Sistem Permintaan Tanya dari awal— Bagian 1
- Qeustion menjawab dengan TensorFlow oleh Steven Hewitt, O'Reilly, 2017
- Mengapa menjawab pertanyaan itu sulit
Berkontribusi
Kontribusi Selamat Datang! Baca Pedoman Kontribusi terlebih dahulu.
Lisensi
Sejauh mungkin berdasarkan hukum, SeriousMac (pemelihara) telah melepaskan semua hak cipta dan hak terkait atau tetangga untuk pekerjaan ini.