이 프로젝트는 언어 모델을 기반으로 관련 작업을 생성하려고합니다. 첫 번째 버전은 백만 수준의 질문을 사용하여 T5 모델을 미세 조정하고 코드는 ./T5_Tuning 디렉토리에 있습니다. 두 번째 버전은 GPT-2를 기반으로 미세 조정을 생성하려고 시도합니다. 이 업데이트는 ChatGLM-6B+LORA를 기반으로 모델의 첫 번째 버전을 미세 조정하고 새로운 유형의 미세 조정 작업을 추가합니다.
(1) ChatGLM-6B+LORA를 기반으로 한 첫 번째 버전의 모델 버전을 업데이트했습니다 (2) 새로 생성 된 Propt 데이터, 새로운 Propt Learning Tasks (4) 쿼리 라이브러리가 4 천만 명에 도달하여 정리했습니다.
(1) 질문에 대한 키워드 생성 (2) 키워드 생성 (3) 미세 조정 유사한 질문 생성을위한 데이터 세트는 ./chatglm_tuning/data 디렉토리, 약 100,000+;
(1) propt_data 데이터 세트에서 3 개의 에포크가 훈련되었습니다.
(2) 초기 3.0에서 약 1.3의 훈련 손실; 약 2Epoch 후, 손실 감소는 특히 느 렸습니다.
(3) 자세한 교육 매개 변수 설정은 코드를 참조하십시오.
#keyword 제어 생성
prompt:帮我生成10条包含[流量,套餐]关键词的问句
answer:
1.移动流量包怎么取消流量套餐
2.手机流量套餐有哪些?价格如何查询呢
3.这个有什么的流量套餐吗?可以换卡了吗
4.有免费的流量套餐吗
5.有没有免费流量套餐推荐一下啊!求大神们解答
6.联通流量超出后需要购买什么流量套餐
7.现在哪个网络套餐送更多流量
8.流量多少合适 选哪种套餐好点
9.电信流量套餐好吗
10.移动流量多吗?买套餐怎么样划算呀!谢谢各位大大回答!!
#Query 키워드 생성
prompt:[美国CPI为何暴涨]问句包含哪些关键词
answer:
包含的关键词有: 美国,CPI
#Smilar 질문 세대
prompt:帮我生成9条与[炒股软件哪个好用]相似的问句
answer:
1.请问有什么好的炒股工具可以推荐吗
2.想要在股市上获得成功,应该选择哪个炒股软件呢?请帮忙解答一下!
3.我想知道有哪些好用的炒股应用程序值得大家使用
4.股市新手应该如何选择适合自己的炒股软件呢
5.能否介绍一下哪些炒股软件适合股票投资者
6.我想学习更多有关股市的知识和技能,有没有好的炒股软件可以参考下的呢
7.现在有很多不同的炒股软件可供选择,不知道哪种最实用、最好用
8.对于刚刚入门的人来说,用什么炒股软件比较合适比较好
9.想请教各位高手们,哪些炒股软件是投资必备的好帮手啊!
(1)이 버전의 훈련 효과로 판단하면 ChatGLM+LORA를 기반으로 한 교육이 충분하지 않으며 Propt_Data의 적합도는 비교적 낮다고 생각합니다. 라운드를 늘리거나 LORA 매개 변수를 조정할지 확실하지 않습니다.
(2) 질문 기반 키워드에 대한 키워드를 생성하는 작업을 수행 할 때 많은 중요한 단어가 인식되지 않으며, 이는 PROPT 데이터의 품질이 낮은 것과 관련이 없습니다.
(1) ChatGLM+LORA 모델을 계속 최적화합니다.
(2) 프롬프트 작업을 추가하거나 최적화합니다.
(3) 쿼리 라이브러리를 적용하거나 지식 기반을 구축하는 방법을 고려하고 모델을 지식 기반과 결합하여 쿼리 관련 생성 작업을 수행하십시오.