artificial self AMLD 2020
1.0.0
該存儲庫包含用於應用機器學習日工作坊的所有資源。
在此研討會中,參與者的任務是下載自己的聊天日誌,並構建一個聊天機器人,該聊天機器人會生成類似於其寫作的文本。作為使用聊天日誌的替代方法,我們在此存儲庫中提供了許多其他對話(和非轉換數據集)數據集。
在研討會期間隨時加入我們的吉特:
在這裡找到車間幻燈片。
研討會分為三個任務。您可以在本地運行每個任務(通過克隆此存儲庫)或運行COLAB筆記本(請參見下面的鏈接)。如果您在本地運行,請確保您可以訪問GPU(S),並且正在運行Python 3.6+(還要確保您有足夠的存儲空間)。不同的子文件夾中提供了更詳細的說明。
各種數據集上的微調GPT-2(包括推文,詩歌,編程代碼,國際象棋,音樂等!)。感謝@Manueth編譯數據集!
➡️閱讀更多
我們使用相同的樣式轉移方法來訓練我們的聊天日誌中的對話模型。您可以使用chandistics解析自己的聊天日誌,也可以使用一些提供的資源。感謝@masterscrat編譯對話數據集!
➡️閱讀更多
我們通過引入多任務學習,改進數據預處理並添加令牌類型來擴展任務2中的方法。
➡️閱讀更多