大廈
Sockeye已進入維護模式,不再添加新功能。我們感謝所有通過拉動請求,發行報告等在整個開發過程中為大紅牛做出了貢獻的每個人。
Sockeye是基於Pytorch建立的神經機器翻譯的開源序列到序列框架。它實施了分佈式培訓並優化了對最先進模型的推斷,為亞馬遜翻譯和其他MT應用程序提供動力。在我們的ChangElog中跟踪了最新的發展和變化。
有關快速啟動指南,以培訓任何大小數據的標準NMT模型,請參見WMT 2014英語 - 德國教程。
有關問題和問題報告,請在Github上提出問題。
版本3.1.x:僅Pytorch
使用3.1.x版本,我們刪除了對MXNET 2.x的支持。經過Pytorch和Sockeye 3.0.x培訓的模型仍與Sockeye 3.1.x.兼容。經過2.3.x(使用MXNET)訓練並使用Sockeye 3.0.X的轉換工具轉換為Pytorch的模型不能與Sockeye 3.1.x一起使用。
版本3.0.0:並發Pytorch和MXNET支持
從版本3.0.0開始,Sockeye也基於Pytorch。我們將與3.0.x版本的2.3.x版本的MXNET模型保持向後兼容。如果安裝了MXNET 2.X,則Sockeye可以使用Pytorch或MXNET運行。
所有經過2.3.x(使用MXNET)訓練的模型都可以使用轉換器CLI( sockeye.mx_to_pt )轉換為使用Pytorch運行的型號。這將創建一個pytorch參數文件( <model>/params.best ),然後將現有的mxnet參數文件備份到<model>/params.best.mx 。請注意,這僅適用於用於推斷的全面訓練模型。不支持使用Pytorch對MXNET模型的繼續培訓(因為我們不轉換培訓和優化器狀態)。 sockeye.mx_to_pt要求將MXNET安裝到環境中。
現在,3.0.0版本的所有CLIS現在使用Pytorch,例如sockeye-{train,translate,score} 。基於MXNET的CLI/模塊仍可以通過sockeye-{train,translate,score}-mx訪問。
可以在沒有MXNET的情況下安裝和運行Sockeye 3,但是如果安裝,則執行擴展的測試套件,以確保Pytorch和MXNET模型之間的等效性。請注意,使用MXNET運行Sockeye 3.0.0需要安裝MXNET 2.x( pip install --pre -f https://dist.mxnet.io/python 'mxnet>=2.0.0b2021' )
安裝
下載當前版本的Mockeye:
git clone https://github.com/awslabs/sockeye.git
安裝Mokeye模塊及其依賴項:
cd sockeye && pip3 install --editable .
對於更快的GPU培訓,請安裝NVIDIA APEX。 NVIDIA還提供包括Apex在內的Pytorch Docker容器。
文件
- 有關如何使用Mockeye的信息,請訪問我們的文檔。
- 開發人員可能對我們的開發人員指南感興趣。
較舊的版本
- Mockeye 3.0,基於Pytorch&Mxnet 2.x,可在
sockeye_30分支中獲得。 -
sockeye_2分支可用,以MXNET GLUON API為基礎,Sockeye 2.x可用。 -
sockeye_1分支可用,基於MXNET模塊API,Sockeye 1.x可用。
引用
有關Cokeye的更多信息,請參見我們的論文(Bibtex)。
大廈3.x
Felix Hieber,Michael Denkowski,Tobias Domhan,Barbara Darques Barros,Celina Dong Ye,Xing Niu,Cuong Hoang,Ke Tran,Benjamin Hsu,Maria Nadejde,Surafel Lakew,Prashant Mathur,Prashant Mathur,Anna Currey,Marcello Federico。 Sockeye 3:帶Pytorch的快速神經機器翻譯。 Arxiv電子打印。
大廈2.x
Tobias Domhan,Michael Denkowski,David Vilar,Xing Niu,Felix Hieber,Kenneth Heafiel。 Amta 2020年的Mokeye 2 Neural Machine Translation Toolkit。
Felix Hieber,Tobias Domhan,Michael Denkowski,David Vilar。 Mockeye 2:用於神經機器翻譯的工具包。歐洲機器翻譯協會第22屆年度會議,項目軌道(EAMT'20)。
大廈1.x
Felix Hieber,Tobias Domhan,Michael Denkowski,David Vilar,Artem Sokolov,Ann Clifton,Matt Post。 AMTA 2018上的紅色神經機器翻譯工具包。美洲機器翻譯協會第13屆會議論文集(AMTA'18)。
Felix Hieber,Tobias Domhan,Michael Denkowski,David Vilar,Artem Sokolov,Ann Clifton和Matt Post。 2017。 Sockeye:神經機器翻譯的工具包。 Arxiv電子打印。
與Cokeye的研究
大海已被用於學術和工業研究。下面顯示了使用Sockeye的已知出版物列表。如果您了解更多,請告訴我們或提交拉動請求(最後更新:2022年5月)。
2023
- Zhang,Xuan,Kevin Duh,Paul McNamee。 “神經機器翻譯研究的超參數優化工具包”。 ACL論文集(2023)。
2022
- Currey,Anna,MariaNădejde,Raghavendra Pappagari,Mia Mayer,Stanislas Lauly,Xing Niu,Benjamin Hsu,Georgiana Dinu。 “ MT-Geneval:一種反事實和上下文數據集,用於評估機器翻譯中的性別準確性”。 EMNLP論文集(2022)。
- Domhan,Tobias,Eva Hasler,Ke Tran,Sony Trenous,Bill Byrne和Felix Hieber。 “魔鬼在細節上:關於神經機器翻譯中詞彙選擇的陷阱”。 NAACL-HLT論文集(2022)
- Fischer,Lukas,Patricia Scheurer,Raphael Schwitter,Martin Volk。 “從拉丁語到德語的16世紀字母的機器翻譯”。歷史和古代語言語言技術研討會(2022)。
- 諾爾斯,麗貝卡,帕特里克·利特爾。 “翻譯記憶是低資源機器翻譯的基線”。 LREC論文集(2022)
- McNamee,Paul,Kevin Duh。 “多語言微博翻譯語料庫:改進和評估用戶生成的文本的翻譯”。 LREC論文集(2022)
- Nadejde Maria,Anna Currey,Benjamin Hsu,Xing Niu,Marcello Federico,Georgiana Dinu。 “可可-MT:對比度受控MT的數據集和基準,並應用正式”。 NAACL會議錄(2022)。
- Weller-Di Marco,Marion,Matthias Huck,Alexander Fraser。 “在神經機器翻譯中建模目標側形態:策略的比較”。 ARXIV預印型ARXIV:2203.13550(2022)
2021
- Bergmanis,Toms,MārcisPinnis。 “促進具有目標引理註釋的術語翻譯”。 ARXIV預印型ARXIV:2101.10035(2021)
- Briakou,Eleftheria,Marine Carpuat。 “超越噪聲:減輕細粒語義差異對神經機器翻譯的影響”。 Arxiv預印型ARXIV:2105.15087(2021)
- Hasler,Eva,Tobias Domhan,Sony Trenous,Ke Tran,Bill Byrne,Felix Hieber。 “改善神經機器翻譯多域適應的質量權衡”。 EMNLP論文集(2021)
- 唐,貢博,菲利普·羅恩,里科·森恩里奇,喬基姆·尼夫爾。 “在神經機器翻譯中重新審視否定”。計算語言學協會的交易9(2021)
- Vu,Thuy,Alessandro Moschitti。 “通過網絡自動培訓數據選擇機器翻譯自定義”。 ARXIV預印型ARXIV:2102.1024(2021)
- Xu,韋吉亞,海洋拼車。 “編輯器:基於編輯的變壓器,並重新定位具有軟詞彙約束的神經機器翻譯。”計算語言學協會的交易9(2021)
- Müller,Mathias,Rico Sennrich。 “了解最小貝葉斯在神經機器翻譯中風險解碼的特性”。計算語言學協會和第11屆國際自然語言處理聯合會議的第59屆年會論文集(第1卷:長論文)(2021年)
- Popović,Maja,Alberto Poncelas。 “用戶評論的機器翻譯。” RANLP論文集(2021)
- Popović,Maja。 “關於觀察到的MT錯誤的自然和原因。”第18 MT峰會論文集(第1卷:研究軌道)(2021)
- Jain,Nishtha,MajaPopović,Declan Groves,Eva Vanmassenhove。 “為NLP生成性別增強數據。”關於自然語言處理中性別偏見的第三屆研討會論文集(2021)
- Vilar,David,Marcello Federico。 “字節對編碼的統計擴展。” IWSLT論文集(2021)
2020
- 迪努(Dinu),喬治亞娜(Georgiana),普拉什特·馬圖爾(Prashant Mathur),馬塞洛·費德里科(Marcello Federico),斯坦尼斯拉斯·萊利(Stanislas Lauly),Yaser Al-noazan。 “端到端本地化的聯合翻譯和單位轉換。” IWSLT論文集(2020)
- Exel,Miriam,Bianka Buschbeck,Lauritz Brandt,Simona Doneva。 “ SAP處的術語受術語受限的神經機譯”。 Eamt會議錄(2020)。
- Hisamoto,Sorami,Matt Post,Kevin Duh。 “會員資格推斷對序列到序列模型的攻擊:我的機器翻譯系統中的數據是嗎?”計算語言學協會的交易,第8卷(2020)
- Naradowsky,Jason,Xuan Zhan,Kevin Duh。 “從匪徒反饋中選擇機器翻譯系統。” ARXIV預印ARXIV:2002.09646(2020)
- Niu,Xing,Prashant Mathur,Georgiana Dinu,Yaser Al-azonizan。 “評估對神經機器翻譯的輸入擾動的魯棒性”。 ARXIV預印ARXIV:2005.00580(2020)
- Niu,Xing,海洋拼車。 “通過合成監督控制神經機器的形式。” AAAI論文集(2020)
- Keung,Phillip,Julian Salazar,Yichao Liu,Noah A. Smith。 “通過自我訓練的上下文嵌入,無監督的bitext挖掘和翻譯。” ARXIV預印型ARXIV:2010.07761(2020)。
- Sokolov,Alex,Tracy Rohlin,Ariya Rastrow。 “用於多語言譜係到詞素轉換的神經機器翻譯。” Arxiv預印型ARXIV:2006.14194(2020)
- Stafanovičs,Artūrs,Toms Bergmanis,MārcisPinnis。 “通過目標性別註釋來減輕機器翻譯中的性別偏見。” ARXIV預印ARXIV:2010.06203(2020)
- Stojanovski,Dario,Alexander Fraser。 “在神經機器翻譯中使用文檔級上下文來解決零資源域。” ARXIV預印型預印型ARXIV:2004.14927(2020)
- Stojanovski,Dario,Benno Krojer,Denis Peskov,Alexander Fraser。 “違反:機器翻譯的對比核心分析模板”。殖民論文集(2020)
- 張,Xuan,凱文·杜(Kevin Duh)。 “可再現和有效的基準測試,用於神經機器翻譯系統的高參數優化。”計算語言學協會的交易,第8卷(2020)
- Swe Zin Moe,Ye Kyaw Thu,Hnin Aye Thant,Nandar Win Min和Thepchai Supnithi,“緬甸手語和緬甸語言之間的無監督神經機器翻譯”,《智能信息學和智能技術雜誌》,2020年4月1日,2020年,第53-61頁,第53-61頁。 (2019年12月21日提交; 2020年3月6日接受; 2020年3月16日修訂;在線發佈於2020年4月30日)
- thazin myint oo,ye kyaw thu,khin mar soe和thepchai supnithi,“緬甸(緬甸)和達維(Tavoyan)之間的神經機器”,在第18屆國際計算機應用國際會議上(ICCA 2020),2720年2月2720年,2020年,Yangon,Myangon,Myanmar,PPP,PP。
- Müller,Mathias,Annette Rios,Rico Sennrich。 “神經機器翻譯中的域魯棒性”。 AMTA論文集(2020)
- Rios,Annette,MathiasMüller,Rico Sennrich。 “子詞細分和單個橋式語言會影響零拍神經機器的翻譯。”第五WMT論文集:研究論文(2020)
- Popović,Maja,Alberto Poncelas。 “類似的南拉語語言之間的神經機器翻譯。”第五WMT論文集:研究論文(2020)
- Popović,Maja,Alberto Poncelas。 “使用字符n-gram匹配從不干淨的平行數據中正確對齊段。”語言技術與數字人文學科會議論文集(JTDH 2020)。
- Popović,Maja,Alberto Poncelas,Marija Brkic,Andy Way。 “神經機器翻譯,用於轉化為克羅地亞和塞爾維亞人。” NLP的第七次研討會論文集,類似語言,品種和方言(2020)
2019
- Agrawal,Sweta,海洋劇院。 “控制神經機器翻譯中的文本複雜性。” EMNLP論文集(2019年)
- 貝克,丹尼爾,特雷弗·科恩,戈拉姆雷扎·哈法利。 “使用晶格轉換和圖形網絡的神經語音翻譯。” TextGraphs-13論文集(EMNLP 2019)
- Currey,Anna,Kenneth Heafiel。 “帶有單語樞軸數據的零資源神經機器翻譯。” EMNLP論文集(2019年)
- 古普塔(Gupta),普拉巴卡(Prabhakar),瑪雅克·夏爾馬(Mayank Sharma)。 “數字娛樂內容字幕的無監督翻譯質量估計。” IEEE國際語義計算雜誌(2019)
- Hu,J。 Edward,Huda Khayrallah,Ryan Culkin,Patrick Xia,Tongfei Chen,Matt Post和Benjamin van Durme。 “改進了詞彙約束解碼,用於翻譯和單語的重寫。” NAACL-HLT論文集(2019)
- Rosendahl,Jan,Christian Herold,Yunsu Kim,MiguelGraça,Weiyue Wang,Parnia Bahar,Yingbo Gao和Hermann Ney“ Rwth Aachen University University Machine Translion Systems for WMT 2019”
- 湯普森,布萊恩,傑里米·格溫納普,哈達·哈拉拉,凱文·杜和菲利普·科恩。 “在神經機器翻譯的域適應域中,克服了災難性的遺忘。” NAACL-HLT 2019(2019)論文集
- Tättar,Andre,Elizaveta Korotkova,Mark Fishel“ Tartu大學的多語言多域WMT19新聞翻譯共享任務提交”第四級WMT論文集:研究論文(2019)
- thazin myint oo,ye kyaw thu和khin mar soe,“緬甸(緬甸)和rakhine(arakanese)之間的神經機器”,在NLP的第六次針對類似語言,品種和言語的NLP研討會上
2018
- Domhan,Tobias。 “您需要多少關注?對神經機器翻譯體系結構的顆粒狀分析”。第56 ACL論文集(2018年)
- Kim,Yunsu,Yingbo Gao和Hermann Ney。 “神經機器翻譯模型的有效跨語性轉移,而無需共享詞彙。” Arxiv預印型ARXIV:1905.05475(2019)
- Korotkova,Elizaveta,Maksym Del和Mark Fishel。 “單語和跨語言的零拍傳輸。” ARXIV預印型ARXIV:1808.00179(2018)
- Niu,Xing,Michael Denkowski和Marine Carpuat。 “帶有合成平行數據的雙向神經機器翻譯。” Arxiv預印型ARXIV:1805.11213(2018)
- Niu,Xing,Sudha Rao和Marine Carpuat。 “多任務神經模型,用於在語言內部和語言之間翻譯樣式。” Coling(2018)
- 郵報,馬特和大衛·維拉爾。 “通過動態束分配的神經機器翻譯,快速詞彙約束解碼。” NAACL-HLT論文集(2018)
- Schamper,Julian,Jan Rosendahl,Parnia Bahar,Yunsu Kim,Arne Nix和Hermann Ney。 “ Aachen University的RWTH ACHEN UNIVERSTION MACHICEND MANICARE TRANSULATION SYSTEMS 2018年。”第三WMT論文集:共享任務文件(2018)
- Schulz,Philip,Wilker Aziz和Trevor Cohn。 “神經機器翻譯的隨機解碼器。” ARXIV預印型ARXIV:1805.10844(2018)
- Tamer,Alkouli,Gabriel Bretschner和Hermann Ney。 “關於基於注意力集中的神經機器翻譯中的對齊問題。”第三WMT論文集:研究論文(2018)
- 唐,貢博,里科·森恩里奇和喬基姆·尼夫爾。 “注意機制的分析:神經機器翻譯中的單詞感覺歧義的情況。”第三WMT論文集:研究論文(2018年)
- 湯普森,布萊恩,哈達·哈拉拉,安東尼奧斯·阿納斯塔索普洛斯,艾莉亞·麥卡錫,凱文·杜(Kevin Duh),麗貝卡·馬文(Rebecca Marvin),保羅·麥克納梅(Paul McNamee),傑里米·格溫納普(Jeremy Gwinnup),蒂姆·安德森(Tim Anderson)和菲利普·科恩(Philipp Koehn)。 “凍結子網以分析神經機器翻譯中的域的適應性。” Arxiv預印型ARXIV:1809.05218(2018)
- 維拉,大衛。 “學習隱藏的單元貢獻,以適應神經機器翻譯模型。” NAACL-HLT論文集(2018)
- Vyas,Yogarshi,Xing niu和Marine Carpuat“在沒有註釋的情況下以平行文本來識別語義差異”。 NAACL-HLT論文集(2018)
- Wang,Weiyue,Derui Zhu,Tamer Alkhouli,Zixuan Gan和Hermann Ney。 “機器翻譯的神經隱藏模型”。第56 ACL論文集(2018年)
- Zhang,Xuan,Gaurav Kumar,Huda Khayrallah,Kenton Murray,Jeremy Gwinnup,Marianna J Martindale,Paul McNamee,Kevin Duh和Marine Carpuat。 “神經機器翻譯的課程學習的經驗探索。” Arxiv預印型ARXIV:1811.00739(2018)
- Swe Zin Moe,Ye Kyaw Thu,Hnin Aye Thant和Nandar Win Min,“緬甸手語和緬甸文字之間的神經機器翻譯”,在第二屆《光學性質識別和自然語言識別和自然語言處理技術》的區域會議上,2018年12月13-14日,2018年12月13-14日,2018年12月13日,2018年12月14日,Phnom Pen,Cambod,Cambod。
- 唐,貢博,馬蒂亞斯·穆勒,安妮特·里奧斯和里科·森恩里奇。 “為什麼要自我注意?對神經機器翻譯體系結構的有針對性評估。” EMNLP論文集(2018)
2017
- Domhan,Tobias和Felix Hieber。 “通過多任務學習,使用目標側單語言數據進行神經機器翻譯。” EMNLP論文集(2017年)。