gpt2 text generation
1.0.0
https://trustmeyourealive.wordpress.com/의 블로그 데이터 세트에서 Openai의 GPT-2를 사용한 미세 조정 및 텍스트 생성.
content-extraction : WordPress API를 사용하여 블로그 데이터 추출
dataset : 추출 된 컨텐츠에서 트레인, 검증, 테스트 데이터 세트
prepare_data.ipynb : 기차, 유효한 테스트 파일에 데이터를 준비하십시오
text_generation.ipyb : 준비된 열차 세트 및 텍스트 생성의 미세 조정 GPT-2
총 토큰 : 246446 (76 개 기사)
어휘 : 50260
훈련 세트 (라인 별) : 2752
복제 후 교체 해야하는 transformers 의 코드 파일 : run_generation.py 및 run_language_modeling.py (text_generation.ipynb의 지침)
솔직히, 나는 경외감/충격을 받았다 -이 시퀀스는 진정으로 나처럼 들렸다.