[ZH] [en]
Llama 모델은 교육용 미세 조정을 통해 일반 분야에서 매우 잘 수행되었습니다. 그러나 적절한 데이터가 없기 때문에 법률 분야에서 LLAMA의 능력을 탐색 한 사람은 거의 없습니다. 이러한 격차를 메우기 위해 우리는 법적 영역 데이터에 대해 추가로 교육을받은 모델 인 변호사 Llama를 제안합니다.
변호사 라마는 먼저 중국의 법적 지식 시스템을 체계적으로 배울 수 있도록 대규모 법적 코퍼스에서 지속적인 사전 여지를 수행했습니다. 이를 바탕으로 ChatGpt를 사용하여 중국의 국가 통합 법률 전문가 자격 시험 (법적 시험이라고 함)에 대한 객관적인 질문 분석을 수집하고 법적 상담에 대한 답변을 사용하여 수집 된 데이터를 사용하여 모델을 미세 조정하여 특정 시나리오에 법적 지식을 적용 할 수있는 능력을 획득 할 수있었습니다.
우리의 모델은 다음과 같습니다.
마스터 중국 법률 지식 : 민법, 형법, 행정법 및 소송법과 같은 공동 분야의 법적 개념을 올바르게 이해할 수 있어야합니다. 예를 들어, 형법에서 범죄 구성 이론을 마스터하는 경우 범죄 사건, 범죄 대상, 범죄 행동, 주관적 심리적 상태 및 기타 범죄 구성 요소를 형사 사건에 대한 사실 설명에서 식별 할 수 있습니다. 이 모델은 법적 개념과 이론을 사용하여 법률 시험의 대부분의 질문에 더 잘 대답합니다.
중국 법률 관행에 적용 : 이해하기 쉬운 언어에서 법적 개념을 해석하고 기본 법적 협의를 수행 할 수 있으며, 결혼, 대출, 해상 상거래 및 형법과 같은 법적 분야를 다루고 있습니다.
중국 법률 모델의 공개 연구에 기여하기 위해이 프로젝트는 LLAMA 교육을 기반으로 한 중국 법률 모델의 일련 의 지침 미세 조정 데이터 및 매개 변수를 공개 할 것입니다.
[2024/4/25]? 변호사 LLAMA 2 ( lawyer-llama-13b-v2 ) 모델 매개 변수 및 고품질의 법적 지침 미세 조정 데이터 의 새로운 버전.
[2023/10/14] 업데이트 된 변호사 라마 기술 보고서 변호사 Llama : 법적 지식으로 LLM 향상 ,보다 기술적 인 세부 사항 및 연구 결과를 제공합니다.
[2023/6/8] 오픈 소스 lawyer-llama-13b-beta1.0 모델 매개 변수.
[2023/5/25] 대규모 교육 미세 조정 데이터의 오픈 소스 및 사용자 문제와 관련된 법률 및 규정을 포함하는 대화 데이터를 게시합니다.
[2023/5/25] 릴리스 변호사 라마 기술 보고서.
[2023/4/13] 2K 법률 테스트 질문에 대한 답변 및 5K 법률 상담 답변에 대한 답변을 포함하여 ChatGpt에 의해 생성 된 교육용 미세 조정 데이터.
우리는 법적 조항, 사법 문서 등을 포함하여 모델의 지속적인 교육을위한 공개 법률 데이터를 수집했습니다.
Alpaca-GPT4 52K 중국어, 52K 영어.
| 파일 이름 | 규모 | 설명하다 |
|---|---|---|
| ? fakao_gpt4.json | 1,000 | GPT-4에서 생성 한 법적 시험 질문에 대한 답변 |
| ? zixun_gpt4.json | 1,000 | GPT-4 법률에 따라 생성 된 법률 상담 대응 |
| Judicial_examination.json | 2,000 | GPT-3.5에 의해 생성 된 법적 시험 질문에 대한 답변 |
| judicial_examination_v2.json | 5,000 | GPT-3.5에 의해 생성 된 법적 시험 질문에 대한 답변 (두 번째 배치) |
| legal_advice.json | 5,000 | GPT-3.5에 의해 생성 된 법적 상담 대응 |
| Legal_counsel_v2.json | 8,000 | GPT-3.5에 의해 생성 된 법적 상담 응답 (두 번째 배치) |
| legal_counsel_with_article_v2.json | 1,000 | GPT-3.5 법률에 따라 생성 된 법적 상담 응답 |
| LUGPLE_COUNSEL_MULTI_TURN_WITH_ARTICLE_V2.JSON | 476 | GPT-3.5 법률에 따라 생성 된 여러 라운드 법적 상담 대화 |
변호사 Llama 2 ( lawyer-llama-13b-v2 )의 교육에서 우리는 새로운 버전의 법적 미세 조정 데이터를 사용했습니다. 다음은 몇 가지 새롭고 오래된 데이터를 비교 한 것입니다.
우리는 JEC-QA 중국 법률 시험 데이터 세트에서 Chatgpt에 테스트 질문을 입력하여 각 답변에 대한 분석을 생성합니다.
다음은 구식 및 새로운 버전의 변호사 라마에서 사용한 데이터를 비교합니다.
| GPT-3.5 세대 | ? GPT-4 세대 |
|---|---|
| 질문 : 재산법에 따르면, 재산권 변경에 대한 다음과 같은 특별 조항이 정확합니까? 상속 또는 유산으로 인해 재산 권리를 얻는 경우 상속 또는 유산의 시작부터 효과가 발생한 후 답변을하기 전에 자세한 추론 프로세스를 제공하십시오. 답변 : 이 진술은 정확합니다. 부동산 법 제 1 조에 따르면, "상속 또는 예약을 통해 재산 권리가 얻어지면 상속 또는 예약의 시작부터 시행됩니다." 이는 사람이 상속 또는 예약을 통해 바로 재산을 얻을 때,이 재산의 효과가 재산 권리를 양도 할 때가 아니라 상속 또는 예약의 시작부터 효력을 발휘한다는 것을 의미합니다. 이는 상속 또는 유산이 재산권을 얻는 법적 방법이기 때문에 재산권의 효과는이 법정 시점부터 시행되어야합니다. | 문제 : 시나리오 분석 : Zhang Owes Li 20,000 위안, Zhang은 40,000 위안의 택시를 가지고 있으며 이제 Zhang은 그의 친구 Wang Wu에게 차를 기증합니다. Li는 Zhang이 다른 귀중한 것들이 없다는 것을 발견했으며,이 선물은 Zhang의 부채 상환에 영향을 미칠 것이므로 그는 법원에 Zhang의 선물 취소를 요청하도록 요청했습니다. 법원은 선물의 효과를 결정해야합니다. 답변 : Zhang은 Li 20,000 Yuan을 빚졌고 Zhang은 Wang Wu에게 40,000 위안의 택시를 주었다. 이 행동은 부채를 피하기 위해 합법적으로 재산을 악의적으로 양도 할 수 있습니다. Li는 법원에 소송을 제기하여 채권자의 권리를 손상으로부터 보호하기 위해 Zhang의 선물을 철회하도록 요청했습니다. 첫째, 중화 인민 공화국 민법 제 254 조에 따르면 채무자가 부동산을 악의적으로 양도하고 채권자의 이익을 해치는 경우 채권자는 채무자의 행동을 철회하도록 국민 법원에 요청할 권리가 있습니다. 이 경우 Zhang의 선물은 재산의 악의적 인 양도로 간주 될 수 있습니다.이 행동은 Zhang이 빚을 빚지고 Zhang은 다른 귀중한 것들을 가지고 있지 않을 때 발생하기 때문입니다. 이 선물은 Li의 부채를 깨닫지 못할 가능성이 높습니다. 둘째, 중화 인민 공화국 민법 제 255 조에 따르면, 철회 권리 행사는 선의의 제 3 자의 권리에 해를 끼치 지 않아야한다. 그러나이 경우, Wang Wu는 선물을받은 당사자로서 좋은 의도를 가지고 있었고 Zhang의 선물이 채권자 (LI)의 이익에 해를 끼칠 것인지 알고 있는지 여부는 선물이 효과적인지 판단하는 열쇠였습니다. Wang Wu가 Zhang의 선물이 부채 상환을 피하기 위해 수행되었다는 것을 알고 있다면 Wang Wu는 선의로 제 3 자로 간주 될 수 없었습니다. 따라서 위의 분석을 바탕으로 Zhang의 선물 행동은 채권자 Li의 이익을 피하고 채무자가 부동산을 악의적으로 양도했을 때 수행되었습니다. 중화 인민 공화국 민법의 관련 조항에 따르면, 법원은 선물 행동이 유효하지 않다고 결정해야합니다. 그러한 판단은 채권자의 이익을 보호하고 재산을 양도함으로써 채무자가 부채를 피하는 것을 막기위한 것입니다. 따라서 법원은 선물의 효과가 유효하지 않다고 판단해야합니다. |
우리는 공개 데이터 세트에서 컨설팅 질문을 수집하고 Chatgpt가 질문에 답변하기 위해 변호사의 역할을 수행 할 수 있도록 Chatgpt를 입력했습니다. 관련 법률을 함께 입력하면 Chatgpt 생성의 품질이 향상 될 수 있습니다.
다음은 구식 및 새로운 버전의 변호사 라마에서 사용한 데이터를 비교합니다.
| GPT-3.5 세대 | ? GPT-4 세대 |
|---|---|
| 질문 : 안녕하세요, 부부는 이혼 후 어떻게 재산을 분배합니까? 답변 : 안녕하세요, 민법의 관련 조항에 따르면, 이혼 후 부부의 재산 분배는 부부 간의 협상을 통해 처리 될 수 있습니다. 합의가없는 경우, 법원은 재산의 특정 상황에 따라 판결을 내릴 필요가 있으며, 어린이, 여성 및 비 결국 당사자의 권리와 이익을 돌보는 원칙에 따라. 임금, 보너스, 노동 보수, 생산, 운영, 투자 소득, 지적 재산권, 상속 또는 기부 재산 및 공동 소유 해야하는 기타 재산을 포함하여 결혼 기간 동안 부부가 얻은 공동 재산은 동일하게 분할됩니다. 결혼 기간 동안 남편과 아내가 획득 한 개인 재산, 개인 상해에 대한 완전한 재산, 보상 또는 보상, 유언장 또는 선물 계약에서 한 당사자에게 속한 것으로 결정된 재산, 한 당사자에 대한 일일 필요성은 해당 당사자에 속해야합니다. 결혼 중에 얻은 재산은 어떻게됩니까? | 질문 : 남편은 종종 집에 가지 않습니다. 나는 그가 밖에 있고 동시에 많은 나쁜 일을 해왔다는 것을 알고 있습니다. 일년에 365 일. 이 상황에 대해 어떻게해야합니까? 답변 : 귀하가 제공하는 상황에 따르면, 남편은 오랫동안 집으로 돌아 오지 않았으며 외부에는 다른 사람들이 있으며, 이는 "배우자가 다른 사람들과 함께 살도록 금지하는"민법 제 1042 조의 조항을 다룰 수 있습니다. 남편이 다른 사람과 함께 살고 있다면, 이것은 법적 위반을 구성하며 피해자로서 해당 법적 조치를 취할 권리가 있습니다. 먼저 증거를 수집해야합니다. 여기에는 남편이 다른 사람들과 함께 살고 있다는 증거, 그가 집에 가지 않는 시간, 그리고“많은 나쁜 일”이라는 증거가 포함되지만 제한되지 않습니다. 증거는 사진, 비디오, 커뮤니케이션 기록, 증인 증언 등이 될 수 있으며, 이는 후속 법적 조치에 중요합니다. 둘째, 남편의 행동이 당신에게 정신적 해를 입히거나 경제적 손실을 일으키는 경우, 민법의 관련 조항에 따라 보상을 청구 할 수 있습니다. 결혼 법은 또한 남편과 아내 사이의 충성의 의무를 규정합니다. 위반되면 부상당한 당사자는 정신적 손상에 대한 보상을 청구 할 권리가 있습니다. 셋째, 남편이 "많은 나쁜 일을 해냈다"고 생각하면 특정 상황을 더 명확히해야합니다. 이러한 행동에는 도덕적 차원에서 불법 범죄 나 "나쁜 것"이 포함됩니까? 불법 또는 범죄 활동이있는 경우 관련 부서에보고하는 것을 고려할 수 있습니다. 이것은 자신의 권리와 이익을 보호하는 행위 일뿐 만 아니라 사회적 책임의 이행이기도합니다. 마지막으로, 이것은 결혼을 끝낼 것인지에 대한 진지한 고려가 필요한 질문입니다. 불충실은 많은 사람들이 이혼하기로 선택한 중요한 이유 중 하나입니다. 당신이 징수 한 증거를 바탕으로,이 단계를 수행하기로 결정한 경우, 당신은 인민 법원에 이혼 소송을 제기하고, 부부의 공동 재산을 나누고, 자녀의 양육권 (있는 경우) 등을 위해 싸우도록 요청할 수 있습니다. 이 과정에서 법적 문제의 복잡성을 고려할 때 귀하를 대신하여보다 전문적인 법률 조언을 제공하고 소송 활동을 수행 할 수있는 전문 변호사의 도움을 구해야 할 수도 있습니다. 대체로, 당신이 직면하고있는 상황은 더 복잡하지만, 당신은 당신의 정당한 권리와 이익을 보호하기 위해 조치를 취할 권리가 있습니다. 열쇠는 증거를 수집하고 상황을 평가하며 필요한 경우 전문적인 법적 도움을 구하는 것입니다. |
다음 버전의 변호사 라마는 현재 공개됩니다.
lawyer-llama-13b-v2 : quzhe/llama_chinese_13b (LLAMA-2는 중국어로 지속적으로 미리 훈련 됨)에 근거하여 SFT는 일반 지침과 GPT-4에 의해 생성 된 법적 지침을 사용하여 결혼 관련 법적 검색 모드를 장착했습니다. 다운로드 주소 및 사용 방법은 demo/run_inference_v2.md 참조하십시오.lawyer-llama-13b-beta1.0 : 중국어-롤라마 -13b를 기반으로 SFT는 결혼 관련 법률 검색 모듈이 장착 된 일반 지침과 GPT-3.5에 의해 생성 된 법적 지침을 사용하여 수행됩니다. 다운로드 주소 및 사용 방법은 demo/run_inference_v1.md 참조하십시오. 우리는 토론 체인에서 200 개의 결혼 관련 상담 질문을 사용하여 다음 모델을 테스트했습니다.
lawyer-llama-13b-v2 )lawyer-llama-13b-beta1.0 )GPT-4를 사용하여 상담 응답의 질을 평가하십시오 (10 점 중). 점수 과정에서 우리는 GPT-4 모델에 유창성, 논리의 관점, 관련없는 법률을 인용했는지 여부, 변호사가 작성한 금 표준 답변과 의미 적으로 일치하는지 여부에 대한 텍스트를 평가하도록 요청했습니다. 각 모델은 다음과 같이 표현됩니다.
| 모델 | 점수 |
|---|---|
| ? 변호사 라마 2 | 6.71 |
| 변호사 라마 1 | 5.61 |
| 디스크-졸림 | 5.70 |
| GPT-3.5 터보 | 6.90 |
| Gemini-1.0-Pro | 6.94 |
lawyer-llama-13b-beta1.0 의 이전 버전의 공연은 이전 버전의 ReadMe를 참조하십시오.
다음은 동일한 문제에 대한 변호사 Llama 2, 변호사 Llama 1 및 Disc-Lawllm의 결과를 보여줍니다.
질문 : 노인을지지하지 않으면 재산을 물려받을 수 없습니까?
관련 법률 :
모델 출력 :
| 디스크-졸림 | 변호사 라마 1 | ? 변호사 라마 2 |
|---|---|---|
| GPT-4 점수 : 4 점 <br> 민법에 따르면, 아이들은 부모를 지원할 의무가 있습니다. 성인 자녀가 지원에 대한 의무를 충족시키지 못하는 경우, 일할 능력이 부족하거나 삶에 어려움이있는 부모는 성인 자녀가 지원을 요구할 권리가 있습니다. 그러므로 법에 따라 노인을지지 할 의무가 이행되지 않으면 상속의 권리가 손실됩니다. 그러나 특정 사례 상황에 근거하여 "상속의 권리 상실"상황이 법원에 의해 결정되어야하며, 지원되지 않는 노인의 모든 행동은 직접 일반화 될 수 없다는 점에 유의해야합니다. | GPT-4 등급 : 3 포인트 <br> 안녕하세요, 중국 법에 따르면, 노인을지지하지 않으면 상속인이 될 수는 없지만, 사망자가 사망 한 경우 그의 재산은 법정 상속의 순서대로 법적 상속인에게 배포됩니다. 동시에, 고인이 사망하기 전에지지 나지지를 제공했다면, 그는 상속을 할당 할 때 특정 치료를 할 수 있습니다. 또한, 고인의 의지에 재산 분배에 대한 조항이있는 경우, 유언장에 따라 실행됩니다. 특정 상황은 무엇입니까? | GPT-4 점수 : 8 포인트 <br> 귀하의 상담에 따르면, 우리는 노인에 대한 지원 부족으로 인해 부동산을 물려받을 수 없는지에 대한 문제를 분석 할 수 있습니다. 우선, 민법 제 1130 조에 따르면, 상속인이 고인에 대한 주요지지 의무를 이행하거나 고인과 함께 살면 상속 재산을 상속보다 더 많이 나눌 수 있습니다. 이것은 상속인이 상속자를 재정적으로지지하거나 자신의 삶 전에 자신의 삶을 돌보면 상속을 더 많이 얻을 수 있음을 의미합니다. 둘째, 민법 제 1125 조는 상속인이 사망 한 사람들을 버리거나 심각한 상황에서 고인을 학대한다면 상속의 권리가 상실 될 것이라고 명시했다. 이것은 상속인이 자신의 생애 전에 고인을 버리거나 학대하면서 자신의 생명이 곤경에 빠지게한다면, 재산을 물려받을 때 제한 될 수 있음을 시사합니다. 그러나 민법은 노인에 대한 지원없이 재산을 물려받을 수 없다고 직접 규정하지 않습니다. 상속 권리의 취득은 주로 노인을지지하는 행위에 직접적으로 의존하기보다는 혈액 관계와 법에 의해 규정 된 상속인의 범위에 기초합니다. 따라서 노인을 지원할 의무가 이행되지 않더라도 상속인은 여전히 재산을 물려받을 권리가 있습니다. 요약하면, 노인을지지하는 행위는 상속의 권리 행사에 영향을 줄 수 있지만, 노인을지지하지 않는 것은 상속을 직접적으로 박탈하지는 않습니다. 상속권의 획득은 주로 혈액 관계와 법에 의해 규정 된 상속인의 자격에 달려 있습니다. 상속 권리에 대해 궁금한 점이있는 경우 상속 권리에 대해 더 많이 배우고 상속 권리 행사에 영향을 미치지 않기 위해 포기 또는 남용이 있는지 여부를 고려하는 것이 좋습니다. |
오픈 과정에서 다음 프로젝트의 도움을 주셔서 감사합니다.
https://jecqa.thunlp.org/
https://opendata.pku.edu.cn/dataset.xhtml?persistentid=doi:10.18170/dvn/olo4g8
https://github.com/tatsu-lab/stanford_alpaca
https://github.com/lianjiatech/belle
https://github.com/ymcui/chinese-llama-alpaca
https://github.com/pointnetwork/point-alpaca
이 프로젝트의 주요 기고자 :
Huang Quzhe*, Tao Mingxu*, Zhang Chen*, Zhenwei*, Jiang Cong, Chen Zhibin, Wu Zirui, Feng Yansong
* 동등한 기여
이 프로젝트는 Feng Yansong 교수의지도하에 수행되었습니다.
많은 개발자들이 변호사 라마의 배치 및 사용을 공유했으며 감사를 표명하고 싶습니다. 관련 커뮤니티 기부금은 다음과 같이 나열됩니다.
lawyer-llama-13b-v2 의 양자화 및 Ollama를 통해 배치 된 #66 ( @yangxiaoshuai2333)을 참조하십시오. 이 프로젝트의 내용은 학업 연구를위한 것이며 사회에 해를 끼칠 수있는 상업 및 기타 목적으로 사용되지 않습니다. 타사 코드와 관련된 부품을 사용하는 경우 해당 오픈 소스 프로토콜을 엄격히 따르십시오.
이 프로젝트에 사용 된 데이터는 Chatgpt에 의해 생성됩니다. 엄격하게 확인되지 않았으며 컨텐츠가 잘못 될 수 있습니다. 사용할 때 신중하게 확인하십시오.
이 프로젝트의 모델 출력은 전문적인 법적 상담 결과가 아니며 잘못된 콘텐츠를 포함 할 수 있습니다. 법률 원조가 필요한 경우 전문가에게 도움을 받으십시오.
이 프로젝트의 내용을 사용 했거나이 프로젝트가 연구에 도움이된다고 생각한다면이 프로젝트를 인용하십시오.
@misc{huang2023lawyer,
title={Lawyer LLaMA Technical Report},
author={Quzhe Huang and Mingxu Tao and Chen Zhang and Zhenwei An and Cong Jiang and Zhibin Chen and Zirui Wu and Yansong Feng},
year={2023},
eprint={2305.15062},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
@misc{Lawyer-LLama,
title={Lawyer Llama},
author={Quzhe Huang and Mingxu Tao and Chen Zhang and Zhenwei An and Cong Jiang and Zhibin Chen and Zirui Wu and Yansong Feng},
year={2023},
publisher={GitHub},
journal={GitHub repository},
howpublished={url{https://github.com/AndrewZhe/lawyer-llama}},
}