研究論文摘要:採用抽象方法和抹布技術的綜合方法
項目概述
該項目旨在開發一個綜合系統來匯總研究論文,並結合AI和NLP中的最新進步。它包括兩個主要方法:
- 抽象文本摘要:使用編碼器編碼器和注意機制利用深層神經網絡,該方法旨在生成簡潔的研究論文摘要。
- LLM和抹布技術的整合:利用大語模型(LLM)的能力(LLMS)和檢索功能的生成(RAG),這種方法著重於產生交互式摘要並從研究論文中提取有價值的見解。
方法論
抽象文本摘要
- 目標:製作封裝研究論文核心思想的解釋摘要。
- 技術:具有註意機制,轉移學習的編碼器模型。
大型語言模型和抹布技術
- 目的:使用LLM進行交互式匯總。
- 過程:微調Lamini LLM,使用NEO4J開發知識圖,並實施抹布方法。
數據源
主要數據源是來自各個領域的研究論文,重點是其引入,方法論和結論部分。
配x限制
- 依賴研究論文數據的可用性和質量。
- 研究論文的多樣性可能會挑戰總結過程。
- LLMS的資源密集型微調。
- 通過抹布方法,潛在的不可預見的挑戰。
?結論
我們的項目旨在將抽象性文本摘要與LLM和抹布技術合併,以開發一種從研究論文中提取見解的獨特方法。
?參考
- Wu Minghao等。 “ Lamini-LM:大規模說明中的一組蒸餾型模型。” ARXIV預印型ARXIV:2304.14402(2023)。
- 劉易斯·帕特里克(Lewis Patrick)等。 “檢索知識密集型NLP任務的生成一代。”神經信息處理系統的進展33(2020):9459-9474。
- Nallapati Ramesh等。 “抽象性文本摘要使用序列到序列的RNN及以後。” ARXIV預印型ARXIV:1602.06023(2016)。
項目貢獻者:Smit Shah,Mayur Bhanushali,Indrajeet Roy