วิธีการเพิ่มข้อมูลสำหรับโมเดลซอร์สโค้ด
หากคุณต้องการเพิ่มกระดาษของคุณอย่าส่งอีเมลถึงเรา ให้อ่านโปรโตคอลเพื่อเพิ่มรายการใหม่และส่งคำขอดึง
เราจัดกลุ่มเอกสารตามการระบุแหล่งที่มาของรหัสการตรวจจับโคลนการตรวจจับข้อบกพร่องและการซ่อมแซมการสรุปรหัสการค้นหารหัสการสมบูรณ์ของรหัสการแปลรหัสการตอบคำถามรหัสการจำแนกปัญหาการทำนายชื่อวิธีและการทำนายประเภท
ที่เก็บนี้ขึ้นอยู่กับบทความการเพิ่มข้อมูลซอร์สโค้ดสำหรับการเรียนรู้อย่างลึกซึ้ง: การสำรวจ คุณสามารถอ้างอิงได้ดังนี้:
@article{zhuo2023source,
title={Source Code Data Augmentation for Deep Learning: A Survey},
author={Terry Yue Zhuo and Zhou Yang and Zhensu Sun and Yufei Wang and Li Li and Xiaoning Du and Zhenchang Xing and David Lo},
year={2023},
eprint={2305.19915},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
ผู้เขียน: Terry Yue Zhuo, Zhou Yang, Zhensu Sun, Yufei Wang, Li Li, Xiaoning DU, Zhenchang Xing, David Lo
หมายเหตุ: WIP จะมีการเพิ่มเอกสารเพิ่มเติมจากกระดาษสำรวจของเราไปยัง repo นี้ในไม่ช้า การสอบถามควรถูกส่งไปยัง [email protected] หรือเปิดปัญหาที่นี่
รหัสการเขียนรหัส
| กระดาษ | ชุดข้อมูลการประเมินผล |
|---|
| การโจมตีตามธรรมชาติสำหรับโมเดลที่ผ่านการฝึกอบรมมาก่อน (ICSE'22) | GCJ |
| Ropgen: ไปสู่การระบุแหล่งที่มาของรหัสที่มีประสิทธิภาพผ่านการแปลงรูปแบบการเข้ารหัสอัตโนมัติ (ICSE'22) | GCJ, GitHub |
| การเพิ่มการเรียนรู้ซอร์สโค้ดด้วยการเพิ่มข้อมูล (Arxiv'23) | GCJ |
| โค้ดที่แตกต่างกันเป็นแนวทางในการสร้างตัวอย่างสำหรับโมเดลรหัสลึก ASE'23 | GCJ |
การตรวจหาโคลน
| กระดาษ | ชุดข้อมูล |
|---|
| การเรียนรู้การแสดงรหัสความคมชัด (EMNLP'22) | JavaScript (เฉพาะกระดาษ) |
| การเพิ่มข้อมูลโดยการแปลงโปรแกรม (JSS'22) | BCB |
| การโจมตีตามธรรมชาติสำหรับโมเดลที่ผ่านการฝึกอบรมมาก่อน (ICSE'22) | BigCloneBench |
| ปลดปล่อยพลังของการเป็นตัวแทนของคอมไพเลอร์ระดับกลางเพื่อปรับปรุงการฝังโปรแกรมประสาท (ICSE'22) | POJ-104, GCJ |
| HELOC: การเรียนรู้แบบตรงกันข้ามกับการแสดงซอร์สโค้ด (ICPC'22) | GCJ, Ojclone |
| คอมโบ: การฝึกอบรมก่อนการฝึกอบรมรหัสไบนารีโดยใช้การเรียนรู้แบบตัดกัน (Arxiv'22) | Binarycorp-3m |
| การประเมินผลการเรียนรู้ที่แตกต่างกับการแสดงรหัสต่างๆสำหรับการตรวจจับการโคลนรหัส (Arxiv'22) | POJ-104, CodeForces |
| สู่การเรียนรู้ (DIS)-ความคล้ายคลึงกันของซอร์สโค้ดจากความแตกต่างของโปรแกรม (ACL'22) | POJ-104, BigCloneBench |
| REACC: กรอบความสมบูรณ์ของรหัสการเรียกคืน (ACL'22) | ตัวประมวลผล |
| เชื่อมโยงโมเดลที่ผ่านการฝึกอบรมมาก่อนและงานดาวน์สตรีมสำหรับการทำความเข้าใจซอร์สโค้ด (ICSE'22) | POJ-104 |
| การเพิ่มการเรียนรู้ซอร์สโค้ดด้วยการเพิ่มข้อมูล: การศึกษาเชิงประจักษ์ (Arxiv'23) | BigCloneBench |
| Clawsat: ไปสู่โมเดลรหัสที่แข็งแกร่งและแม่นยำ (Saner'22) | - |
| Contrabert: การปรับปรุงโมเดลที่ผ่านการฝึกอบรมของรหัสผ่านการเรียนรู้แบบตรงกันข้าม (ICSE'22) | POJ-104 |
| เส้นทางที่จะใช้ประโยชน์จากการเพิ่มข้อมูลที่ใช้ transcompiler สำหรับการตรวจจับโคลนข้ามภาษา (ICPC'23) | CLCDSA |
| การสร้างตัวอย่างที่แตกต่างจากรหัสการสร้างแบบจำลองรหัสลึก (ASE'23 | BigCloneBench |
| วิธีการฝึกอบรมล่วงหน้าสำหรับการแสดงรหัสขั้นสูงขึ้นอยู่กับการเรียนรู้แบบหลายรูปแบบ (JOS'23) | POJ-104, BigCloneBench |
| คองคอร์ด: การเรียนรู้ที่แตกต่างจากโคลนสำหรับซอร์สโค้ด (ISSTA'23) | Codenet (Java), POJ104 |
| Neuro-Symbolic zero-shot code cloning ด้วยการแสดงข้ามภาษากลาง (Arxiv'23) | Codenet (C, COBOL) |
| การโจมตีแบ็คดอร์หลายเป้าหมายสำหรับโมเดลที่ผ่านการฝึกอบรมของรหัส (ACL'23) | BCB |
การตรวจจับและซ่อมแซมข้อบกพร่อง
| กระดาษ | ชุดข้อมูล |
|---|
| ตัวอย่างที่เป็นปฏิปักษ์สำหรับแบบจำลองของรหัส (oopsla'20) | Varmisuse |
| การตรวจจับข้อผิดพลาดและการซ่อมแซมตนเอง (Neurips'21) | Randombugs, pypibugs |
| ความเข้าใจด้านความเข้าใจด้านความหมายของรหัสฝ่ายตรงข้าม (coling'22) | ข้อบกพร่อง 4J |
| การฝังรหัสที่ไวต่อพา ธ ผ่านการเรียนรู้แบบตรงกันข้ามสำหรับการตรวจจับช่องโหว่ซอฟต์แวร์ (ISSTA'22) | d2a, fan, devign |
| การโจมตีตามธรรมชาติสำหรับโมเดลที่ผ่านการฝึกอบรมมาก่อน (ICSE'22) | เวทมนตร์ |
| คอมโบ: การฝึกอบรมก่อนการฝึกอบรมรหัสไบนารีโดยใช้การเรียนรู้แบบตัดกัน (Arxiv'22) | Sysevr |
| สู่การเรียนรู้ (DIS)-ความคล้ายคลึงกันของซอร์สโค้ดจากความแตกต่างของโปรแกรม (ACL'22) | เปิดเผย codexglue |
| การเพิ่มการเรียนรู้ซอร์สโค้ดด้วยการเพิ่มข้อมูล: การศึกษาเชิงประจักษ์ (Arxiv'23) | refactory, codrep1 |
| MixCode: การเพิ่มการจำแนกรหัสโดยการเพิ่มข้อมูลแบบผสมผสาน (Saner'23) | refactory, codrep1 |
| Contrabert: การปรับปรุงโมเดลที่ผ่านการฝึกอบรมของรหัสผ่านการเรียนรู้แบบตรงกันข้าม (ICSE'23) | เวทมนตร์ |
| การสร้างตัวอย่างที่แตกต่างจากรหัสการสร้างแบบจำลองรหัสลึก (ASE'23) | Devign, CodeChef |
| Mufin: การปรับปรุงรูปแบบการซ่อมแซมประสาทด้วยการแปลกลับ (Arxiv'23) | ข้อบกพร่อง 4J (เฉพาะกระดาษ), quixbugs (เฉพาะกระดาษ) |
| การใช้ประโยชน์จากการอนุมานเชิงสาเหตุสำหรับการซ่อมแซมโปรแกรมอัตโนมัติที่อธิบายได้ (ijcnn'22) | ข้อบกพร่อง 4j, quixbugs, bugaid |
| DeepDebug: แก้ไขข้อบกพร่องของงูหลามโดยใช้ร่องรอยสแต็ก backtranslation และโครงกระดูกรหัส (arxiv'21) | เฉพาะกระดาษ |
| break-it-fix-it: การเรียนรู้ที่ไม่ได้รับการดูแลสำหรับการซ่อมแซมโปรแกรม (Arxiv'21) | deepfix เฉพาะกระดาษ |
| การโจมตีแบ็คดอร์หลายเป้าหมายสำหรับโมเดลที่ผ่านการฝึกอบรมของรหัส (ACL'23) | Devign bug2fix |
| inferfix: การซ่อมแซมโปรแกรมแบบ end-to-end ด้วย LLMS มากกว่าการดึงข้อมูลพร้อมท์ (Arxiv'23) | ที่อนุมานได้ |
| RAP-GEN: การสร้างแพตช์แบบดึงข้อมูลพร้อม Codet5 สำหรับการซ่อมแซมโปรแกรมอัตโนมัติ (FSE'23) | tfix, bug2fix, ข้อบกพร่อง 4j |
| รายงานข้อผิดพลาดน้อยเกินไป? การสำรวจการเพิ่มข้อมูลสำหรับการแปลข้อผิดพลาดที่ได้รับการปรับปรุงให้ดีขึ้น (Arxiv'23) | ข้อมูลโลคัส |
การสรุปรหัส
| กระดาษ | ชุดข้อมูล |
|---|
| การฝึกอบรมแบบจำลองการสร้างความคิดเห็นของรหัสลึกผ่านการเพิ่มข้อมูล (InternetWare'20) | TL-codesum |
| การสรุปซอร์สโค้ดของระบบประสาทตามการดึงข้อมูล (ICSE'20) | PCSD, JCSD |
| การสร้างโปรแกรมคอมพิวเตอร์ที่เป็นปฏิปักษ์โดยใช้การทำให้งงงวยที่ดีที่สุด (ICLR'21) | Python-150k, code2seq data |
| การเรียนรู้การแสดงรหัสความคมชัด (EMNLP'21) | JavaScript (เฉพาะกระดาษ) |
| กรอบการทดสอบตามการค้นหาสำหรับเครือข่ายประสาทลึกของการฝังซอร์สโค้ด (ICST'21) | เฉพาะกระดาษ |
| การสร้างการเรียกคืนการรวมรหัสผ่านการสรุปรหัสผ่านไฮบริด GNN (ICLR'21) | CCSD (เฉพาะกระดาษ) |
| Bashexplainer: การเรียกคืนการเรียกคืนรหัสการสร้างความคิดเห็นตาม Codert ที่ปรับแต่งอย่างละเอียด (ICMSE'22) | ข้อมูล bashexplaner |
| การเพิ่มข้อมูลโดยการแปลงโปรแกรม (JSS'22) | com |
| ความทนทานของฝ่ายตรงข้ามของการสร้างความคิดเห็นรหัสลึก (Tosem'22) | CCSD (เฉพาะกระดาษ) |
| ไม่มีข้อมูลเพียงพอหรือไม่? การเพิ่มข้อมูลง่ายๆสำหรับการสรุปรหัส (PAAP'22) | - |
| ความหมายแบบความหมายของโมเดลของซอร์สโค้ด (Saner'22) | Python-150k, code2seq data |
| การมองอย่างใกล้ชิดกับรหัสข่าวกรองที่ใช้หม้อแปลงผ่านการแปลงรหัส: ความท้าทายและโอกาส (Arxiv'22) | CodeSearchNet (Python, Java) |
| Clawsat: ไปสู่โมเดลรหัสที่แข็งแกร่งและแม่นยำ (Saner'23) | - |
| การสำรวจการเพิ่มข้อมูลสำหรับงานสร้างรหัส (EACL'23) | CodeSearchNet (codexglue) |
| การสร้างความคิดเห็นทุบตีผ่านการเพิ่มข้อมูลและ Codert ที่รับรู้ความหมาย (Arxiv'23) | ข้อมูล bashexplaner |
| Readsum: Transferical Adaptive Transformer สำหรับการสรุปซอร์สโค้ด (Access'23) | PCSD |
| รถราง: กลไกการดึงข้อมูลระดับโทเค็นสำหรับการสรุปซอร์สโค้ด (Arxiv'23) | PCSD, CCSD, DeepCom |
| นกสองตัวที่มีหินหนึ่งก้อน: การเพิ่มการสร้างรหัสและการค้นหารหัสผ่านเครือข่ายฝ่ายตรงข้ามกำเนิด (oopsla'23) | CodeSearchNet (Python, Java) |
| รูปแบบภาษาที่ดีกว่าของรหัสผ่านการพัฒนาตนเอง (ACL'23) | CodeSearchNet |
การค้นหารหัส
| กระดาษ | ชุดข้อมูล |
|---|
| AugmentedCode: ตรวจสอบผลกระทบของทรัพยากรภาษาธรรมชาติในโมเดลการดึงรหัส (Arxiv'21) | CodeSearchNet |
| COSQA: 20, 000+ การค้นหาเว็บสำหรับการค้นหารหัสและการตอบคำถาม (ACL'21) | Cosqa |
| กรอบการทดสอบตามการค้นหาสำหรับเครือข่ายประสาทลึกของการฝังซอร์สโค้ด (ICST'21) | เฉพาะกระดาษ |
| ความเข้าใจด้านความเข้าใจด้านความหมายของรหัสฝ่ายตรงข้าม (coling'22) | CodeSearchNet |
| การสำรวจการเพิ่มระดับการเป็นตัวแทนสำหรับการค้นหารหัส (EMNLP'22) | CodeSearchNet |
| การเรียนรู้ที่ตรงกันข้ามกับการค้นหารหัส (icsme'22) | advtest, cosqa |
| เชื่อมโยงโมเดลที่ผ่านการฝึกอบรมมาก่อนและงานดาวน์สตรีมสำหรับการทำความเข้าใจซอร์สโค้ด (ICSE'22) | CodeSearchNet |
| การมองอย่างใกล้ชิดกับรหัสข่าวกรองที่ใช้หม้อแปลงผ่านการแปลงรหัส: ความท้าทายและโอกาส (Arxiv'22) | CodeSearchNet (Python, Java) |
| Contrabert: การปรับปรุงโมเดลที่ผ่านการฝึกอบรมของรหัสผ่านการเรียนรู้แบบตรงกันข้าม (ICSE'23) | AdvTest, WebQueryTest |
| Cocosoda: การเรียนรู้ที่แตกต่างอย่างมีประสิทธิภาพสำหรับการค้นหารหัส (ICSE'23) | CodeSearchNet |
| การเรียนรู้แบบตรงกันข้ามกับการเพิ่มข้อมูลตามคำหลักสำหรับการค้นหารหัสและการตอบคำถามรหัส (EACL'23) | webQueryTest |
| วิธีการฝึกอบรมล่วงหน้าสำหรับการแสดงรหัสขั้นสูงขึ้นอยู่กับการเรียนรู้แบบหลายรูปแบบ (JOS'23) | CodeSearchNet |
| ทบทวนคู่ลบในการค้นหารหัส (emnlp'23) | CodeSearchNet |
| ไปสู่การค้นหารหัสหลายภาษาที่ดีขึ้นผ่านการเรียนรู้แบบข้ามภาษา (Internetware'23) | xlcost |
| McOdesearcher: การเรียนรู้แบบหลายมุมมองสำหรับการค้นหารหัส (InternetWare'23) | CodeSearchNet (Python, Java), Cosqa, STAQC, WebQuery |
| MULCS: ไปสู่การเป็นตัวแทนลึกแบบรวมสำหรับการค้นหารหัสหลายภาษา (Saner'23) | CodeSearchNet (Python, Java), เฉพาะกระดาษ |
| นกสองตัวที่มีหินหนึ่งก้อน: การเพิ่มการสร้างรหัสและการค้นหารหัสผ่านเครือข่ายฝ่ายตรงข้ามกำเนิด (oopsla'23) | CodeSearchNet (Python, Java) |
เสร็จสิ้นรหัส
| กระดาษ | ชุดข้อมูล |
|---|
| การสร้างแบบจำลองรหัสการกำเนิดด้วยกราฟ (ICLR'19) | ข้อมูล exprgen (เฉพาะกระดาษ) |
| ความทนทานของฝ่ายตรงข้ามของโมเดลการสังเคราะห์โปรแกรม (aiplans'21) | Algolisp |
| REACC: กรอบความสมบูรณ์ของรหัสการเรียกคืน (ACL'22) | PY150 (codexglue), githhub java (codexglue) |
| การเรียนรู้หลายงานที่ขับเคลื่อนด้วยการทดสอบด้วยการแปลงรหัสที่เทียบเท่ากับการสร้างรหัสประสาท (ASE'22) | MBPP |
| ชื่อวิธีที่ดีในการสร้างรหัสประสาทมีความสำคัญอย่างไร? มุมมองความทนทานของแบบจำลอง (Arxiv'22) | concode ที่ได้รับการกลั่น, pytorrent |
| การมองอย่างใกล้ชิดกับรหัสข่าวกรองที่ใช้หม้อแปลงผ่านการแปลงรหัส: ความท้าทายและโอกาส (Arxiv'22) | CodeSearchNet (Python, Java) |
| Recode: การประเมินความทนทานของโมเดลการสร้างรหัส (ACL'23) | Humaneval, MBPP |
| Clawsat: ไปสู่โมเดลรหัสที่แข็งแกร่งและแม่นยำ (Saner'23) | - |
| การเลือกพรอมต์แบบดึงข้อมูลสำหรับการเรียนรู้ไม่กี่นัดที่เกี่ยวข้องกับรหัส (ICSE'23) | Atlas, tfix |
| Rustgen: วิธีการเสริมสำหรับการสร้างรหัสสนิมที่รวบรวมได้ด้วยโมเดลภาษาขนาดใหญ่ | เฉพาะกระดาษ |
| การโจมตีแบ็คดอร์หลายเป้าหมายสำหรับโมเดลที่ผ่านการฝึกอบรมของรหัส (ACL'23) | GitHhub Java (codexglue) |
| การปรับรหัสการปรับเปลี่ยนโดเมนผ่านแบบจำลองภาษาและฐานข้อมูลโดเมนแยกส่วน (ASE'23) | เฉพาะกระดาษ |
| APICOM: API AUTOMATION เสร็จสิ้นผ่านการเรียนรู้ที่รวดเร็วและการเพิ่มข้อมูลการฝึกอบรมที่เป็นปฏิปักษ์ (InternetWare'23) | เฉพาะกระดาษ |
| การเรียนรู้หลายงานที่ขับเคลื่อนด้วยการทดสอบด้วยการแปลงรหัสที่เทียบเท่ากับการสร้างรหัสประสาท (ASE'22) | MBPP |
| รูปแบบภาษาที่ดีกว่าของรหัสผ่านการพัฒนาตนเอง (ACL'23) | มัด |
การแปลรหัส
| กระดาษ | ชุดข้อมูล |
|---|
| ใช้ประโยชน์จากการทดสอบหน่วยอัตโนมัติสำหรับการแปลรหัสที่ไม่ได้รับการดูแล (ICLR'23) | กระดาษเสริม |
| การสำรวจการเพิ่มข้อมูลสำหรับงานสร้างรหัส (EACL'23) | codetrans (codexglue) |
| สรุปและสร้างเป็น back-translate: การแปลภาษาการเขียนโปรแกรมที่ไม่ได้รับการดูแล (EACL'23) | ข้อมูล transcoder |
| Contrabert: การปรับปรุงโมเดลที่ผ่านการฝึกอบรมของรหัสผ่านการเรียนรู้แบบตรงกันข้าม (ICSE'23) | codetrans (codexglue) |
| การแปลรหัสด้วยการแสดงคอมไพเลอร์ (ICLR'23) | ข้อมูล transcoder |
| การเพิ่มข้อมูลสำหรับการแปลรหัสด้วย corpora ที่เทียบเคียงได้และการอ้างอิงหลายรายการ (EMNLP'23) | ข้อมูล transcoder |
| การประเมินและปรับปรุงความทนทานต่อความทนทานของวากยสัมพันธ์ของโมเดลที่ผ่านการฝึกอบรมมาก่อนสำหรับการแปลรหัส (Arxiv'23) | อวตาร |
| การโจมตีแบ็คดอร์หลายเป้าหมายสำหรับโมเดลที่ผ่านการฝึกอบรมของรหัส (ACL'23) | ข้อมูล transcoder |
การตอบคำถามรหัส
| กระดาษ | ชุดข้อมูล |
|---|
| COSQA: 20, 000+ การค้นหาเว็บสำหรับการค้นหารหัสและการตอบคำถาม (ACL'21) | Cosqa |
| ความเข้าใจด้านความเข้าใจด้านความหมายของรหัสฝ่ายตรงข้าม (coling'22) | codeqa |
| การเรียนรู้แบบตรงกันข้ามกับการเพิ่มข้อมูลตามคำหลักสำหรับการค้นหารหัสและการตอบคำถามรหัส (EACL'23) | Cosqa |
| McOdesearcher: การเรียนรู้แบบหลายมุมมองสำหรับการค้นหารหัส (InternetWare'23) | WebQuery (เฉพาะกระดาษ) |
การจำแนกรหัส
| กระดาษ | ชุดข้อมูล |
|---|
| การสร้างตัวอย่างที่เป็นปฏิปักษ์สำหรับการรักษาความทนทานของรูปแบบการประมวลผลซอร์สโค้ด (AAAI'20) | OJ |
| การสร้างตัวอย่างที่เป็นปฏิปักษ์ของแบบจำลองการจำแนกรหัสซอร์สผ่านกระบวนการตัดสินใจของ Markov-learning (qrs'21) | OJ |
| HELOC: การเรียนรู้แบบตรงกันข้ามกับการแสดงซอร์สโค้ด (ICPC'22) | GCJ, OJ |
| คอมโบ: การฝึกอบรมก่อนการฝึกอบรมรหัสไบนารีโดยใช้การเรียนรู้แบบตัดกัน (Arxiv'22) | POJ-104 (codexglue) |
| เชื่อมโยงโมเดลที่ผ่านการฝึกอบรมมาก่อนและงานดาวน์สตรีมสำหรับการทำความเข้าใจซอร์สโค้ด (ICSE'22) | POJ-104 |
| การเพิ่มการเรียนรู้ซอร์สโค้ดด้วยการเพิ่มข้อมูล: การศึกษาเชิงประจักษ์ (Arxiv'23) | Java250, Python800 |
| MixCode: การเพิ่มการจำแนกรหัสโดยการเพิ่มข้อมูลแบบผสมผสาน (Saner'23) | Java250, Python800 |
| การสร้างตัวอย่างที่แตกต่างจากรหัสการสร้างแบบจำลองรหัสลึก (ASE'23) | GCJ |
| วิธีการเพิ่มข้อมูลที่ได้รับการปรับปรุงเพื่อรองรับการจำแนกความสามารถในการอ่านรหัสหลายคลาส (SEKE'22) | เฉพาะกระดาษ |
| การปรับปรุงการจำแนกความสามารถในการอ่านรหัสหลายชั้นด้วยวิธีการเพิ่มข้อมูลขั้นสูง (130) (วารสารนานาชาติวิศวกรรมซอฟต์แวร์และวิศวกรรมความรู้) | เฉพาะกระดาษ |
วิธีการทำนายชื่อ
| กระดาษ | ชุดข้อมูล |
|---|
| ตัวอย่างที่เป็นปฏิปักษ์สำหรับแบบจำลองของรหัส (oopsla'20) | code2vec |
| กรอบการทดสอบตามการค้นหาสำหรับเครือข่ายประสาทลึกของการฝังซอร์สโค้ด (ICST'21) | เฉพาะกระดาษ |
| เกี่ยวกับความสามารถทั่วไปของโมเดลโปรแกรมประสาทที่เกี่ยวข้องกับการแปลงโปรแกรมการรักษาความหมาย (IST'21) | code2seq |
| การเพิ่มข้อมูลโดยการแปลงโปรแกรม (JSS'22) | code2vec |
| การโจมตีแบบไม่ต่อเนื่องในรูปแบบของรหัส (PLDI'23) | code2vec |
ประเภทการทำนาย
| กระดาษ | ชุดข้อมูล |
|---|
| ความทนทานของฝ่ายตรงข้ามสำหรับรหัส (ICML'21) | Deeptyper |
| การเรียนรู้การแสดงรหัสความคมชัด (EMNLP'21) | Deeptyper |
| การเรียนรู้การถ่ายโอนข้ามภาษาสำหรับการอนุมานประเภททางสถิติ (ISSTA'22) | Deeptyper, Typilus (Python), CodeSearchNet (Java) |
การรับทราบ
เราขอขอบคุณ Steven Y. Feng และคณะ สำหรับรายการกระดาษโอเพ่นซอร์สของพวกเขาใน dataaug4nlp