研究论文摘要:采用抽象方法和抹布技术的综合方法
项目概述
该项目旨在开发一个综合系统来汇总研究论文,并结合AI和NLP中的最新进步。它包括两个主要方法:
- 抽象文本摘要:使用编码器编码器和注意机制利用深层神经网络,该方法旨在生成简洁的研究论文摘要。
- LLM和抹布技术的整合:利用大语模型(LLM)的能力(LLMS)和检索功能的生成(RAG),这种方法着重于产生交互式摘要并从研究论文中提取有价值的见解。
方法论
抽象文本摘要
- 目标:制作封装研究论文核心思想的解释摘要。
- 技术:具有注意机制,转移学习的编码器模型。
大型语言模型和抹布技术
- 目的:使用LLM进行交互式汇总。
- 过程:微调Lamini LLM,使用NEO4J开发知识图,并实施抹布方法。
数据源
主要数据源是来自各个领域的研究论文,重点是其引入,方法论和结论部分。
配x限制
- 依赖研究论文数据的可用性和质量。
- 研究论文的多样性可能会挑战总结过程。
- LLMS的资源密集型微调。
- 通过抹布方法,潜在的不可预见的挑战。
?结论
我们的项目旨在将抽象性文本摘要与LLM和抹布技术合并,以开发一种从研究论文中提取见解的独特方法。
?参考
- Wu Minghao等。 “ Lamini-LM:大规模说明中的一组蒸馏型模型。” ARXIV预印型ARXIV:2304.14402(2023)。
- 刘易斯·帕特里克(Lewis Patrick)等。 “检索知识密集型NLP任务的生成一代。”神经信息处理系统的进展33(2020):9459-9474。
- Nallapati Ramesh等。 “抽象性文本摘要使用序列到序列的RNN及以后。” ARXIV预印型ARXIV:1602.06023(2016)。
项目贡献者:Smit Shah,Mayur Bhanushali,Indrajeet Roy