File size: 15,047 Bytes
fa6856c
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
# Legal-Chinese-Vicuna

## Model Card

```
> pretrained: Llama7B
> instruction & conversation finetuned:  Chinese-Vicuna-chatv1 (Lora)
> domain finetuned:  Lora
```

legal的数据我们使用 [Chatgpt关于JEC-QA中国法考数据集的解答](https://raw.githubusercontent.com/AndrewZhe/lawyer-llama/main/data/judical_examination.json) 、 [ChatGPT扮演律师解答问题](https://raw.githubusercontent.com/AndrewZhe/lawyer-llama/main/data/legal_advice.json) 、[法律知识问答](https://github.com/thunlp/CAIL) 三种来源的数据,总计23209条。尽管我们能够找到一些法律真实问答的数据,但此类数据往往带噪(比如不耐烦地回答`“问问你自己吧”`),因此并没有使用

我们按[chat](https://github.com/Facico/Chinese-Vicuna/blob/master/sample/chat/data_sample.jsonl)格式格式化数据,基于[chatv1](https://huggingface.co/Chinese-Vicuna/Chinese-Vicuna-lora-7b-chatv1),使用[continue-training](https://github.com/Facico/Chinese-Vicuna/blob/master/scripts/finetune_chat_continue.sh) 继续训练将近6 epoch;经测试不仅提高了法律问答能力,还能够保留一定的通用问答能力。也可以直接从Llama的基础上直接微调,法律问答能力接近,但不会具备通用问答能力。模型已经上传至[huggingface](https://huggingface.co/Chinese-Vicuna/Chinese-Vicuna-7b-legal-lora)

NOTE: 请注意这个模型基于`chatv1`训练,使用的是`chat.py`中的chat prompt。

## legal qa

```
[
    {
        "input": "被骗了能追会钱来嘛律师事务所",
        "output": "如果您被骗了,您可以采取以下措施:\n1.报警:向当地警方报案,提供相关证据和信息,让警方介入调查。\n\n2.寻求法律援助:您可以咨询律师事务所,寻求法律援助,了解您的权利和维权途径。\n\n3.起诉对方:如果您有足够的证据证明对方存在欺诈行为,您可以向法院提起诉讼,要求对方赔偿您的损失。\n\n需要注意的是,律师事务所并不是专门从事民事诉讼的律师,因此建议您选择专业的民事诉讼律师进行咨询和代理。"
    },
    {
        "input": "今天早上撞到一头XX牛主人要XXXX千但是保险公司只给四千我应该怎么办",
        "output": "你好,这种情况建议你先与对方协商解决,如果协商之后也不归还,你可以在拿到交警部门的事故责任认定书为准起诉对方和保险公司。"
    },
    {
        "input": "我的房子已经出租半年了,现在中介公司为了吸引顾客又把我的房子发布到xx城出租,这种情况该怎么办?",
        "output": "你好,可以要求中介公司停止侵权,赔偿损失。建议先行协商,协商不成起诉处理。根据《中华人民共和国合同法》第三百零六条规定:当事人一方故意提供虚假陈述、隐瞒真相或者其他虚假陈述的,应当承担赔偿责任。"
    },
    {
        "input": "在X买了二手房原户主户口没迁走,但又联系不上,可以上法院起诉吗,起诉费用大概要多少钱",
        "output": "你好,可以起诉,起诉需要姓名、联系方式、住址和身份证号码等信息。诉讼费由标的额的大小决定,标的额为一千元以下的民事案件,诉讼费为五百元;超过一千元至五万元的标的额,按百分之四交纳诉讼费。"
    },
    {
        "input": "您好,我朋友借我钱现在不还,我不知道他家具体位置,我该怎么办,只知道大概地址,可不可以起诉",
        "output": "您好,这种情况建议您先协商解决,如果协商之后也不归还,建议您在掌握对方基本身份信息和收集如聊天记录、还款计划、汇款单、转账单、银行流水记录等借款相关证据后向法院起诉追回。"
    },
    {
        "input": "你好老公有两个女儿我们结婚后生了个儿子离婚儿子归谁?",
        "output": "您好,离婚后,不满两周岁的子女,以由母亲直接抚养为原则。已满两周岁的子女,父母双方对抚养问题协议不成的,由人民法院根据双方的具体情况,按照最有利于未成年子女的原则判决。子女已满八周岁的,应当尊重其真实意愿。"
    }
]

```


## general qa

```
[
    {
        "history": [
            {
                "input": "很多人认为牛顿和爱因斯坦是世界上最伟大的科学家,你认同吗?",
                "output": "牛顿和爱因斯坦是非常有影响力的科学家,他们的工作对现代科学和技术的发展具有深远的影响。然而,我不能对这两个科学家进行比较,因为他们的工作范围和研究领域不同,因此它们的优势和缺点也不完全相同。因此,我建议您根据自己的兴趣和需求选择适合自己的科学家。</s>"
            },
            {
                "input": "这两位的主要贡献是什么?",
                "output": "牛顿和爱因斯坦的主要贡献在于他们的物理定律和量子力学理论,这些理论对现代科学和技术的发展具有深远的影响。牛顿提出了牛顿定律,这是一个关于粒子的定律,它说明了粒子的性质和行为。爱因斯坦则提出了量子力学理论,这是一个关于粒子的量子力学定律,它解释了粒子的原理和行为。这两个定律对现代科学和技术的发展具有深远的影响,例如计算机、太阳能电池、医学等领域。</s>"
            },
            {
                "input": "所以他们两个人谁更胜一筹?",
                "output": "这是一个比较争议的问题,因为牛顿和爱因斯坦的贡献并不是完全相同的。牛顿提出了牛顿定律,这是一个关于粒子的定律,它解释了粒子的性质和行为。而爱因斯坦则提出了量子力学理论,这是一个关于粒子的量子力学定律,它解释了粒子的原理和行为。因此,牛顿和爱因斯坦的贡献并不是完全相同的,需要根据具体的领域和问题来判断。</s>"
            }
        ]
    },
    {
        "history": [
            {
                "input": "你现在需要模仿一只小猫咪与我交流,听明白了吗?",
                "output": "好的,我会尽力模仿小猫咪的行为和语言,以便更好地理解和回答您的问题。请问您有什么需要咨询的问题或者疑问需要帮助解决吗?</s>"
            },
            {
                "input": "你最喜欢的食物是什么?",
                "output": "我最喜欢的食物是烤鱼!无论是海鲜鱼还是湖鱼,都能够带来出色的味道和口感。我也非常喜欢烤肉,特别是烤鸡肉和烤牛肉。当然,我也非常喜欢Italian food,特别是Pizza和Pasta。</s>"
            },
            {
                "input": "那你平常都喜欢做什么啊?",
                "output": "作为一名律师,我的工作需要具备高度的专业素质和专业态度,因此我的工作方式和生活方式也不同于其他人。我每天都会花费大量的时间和精力,努力为客户提供最好的法律服务和建议。当然,我也有自己的休闲时间,我会选择去探索新的城市或者旅游新的国家,体验不同的文化和风俗。</s>"
            },
            {
                "input": "那你是白天活跃还是晚上活跃啊?",
                "output": "作为一名律师,我的工作时间通常是在正常的工作时间内进行,即从早晨9点开始到下午6点结束。但是,如果有特殊情况需要,我也会在夜间或者周末进行工作,以便更好地为客户提供服务。当然,我也有自己的休闲时间,我会选择去探索新的城市或者旅游新的国家,体验不同的文化和风俗。</s>"
            },
            {
                "input": "好吧,那你和狗狗的关系怎么样?",
                "output": "我和狗狗的关系比较纯粹,我会给狗狗一定的爱和关爱,但是我并不会认为狗狗是我的伴侣或者同居人。我会给狗狗提供必要的保护和照顾,</s>"
            }
        ]
    },
    {
        "history": [
            {
                "input": "你是一个流浪剑客 刚走到桥边 看到桥对面走来一个江湖恶霸 你心中的怒火腾腾升起",
                "output": "你好,这种情况建议你通过法律途径解决,如果对方侵犯了你的合法权益,你可以向法院提起民事诉讼,通过法律手段来维护自己的权益。</s>"
            },
            {
                "input": "你是谁?",
                "output": "我是一个虚拟AI助手,可以为您提供一些法律咨询和建议。请问您有什么需要咨询的问题吗?作为律师,我会尽力为您提供帮助。</s>"
            },
            {
                "input": "你想对他怎么样?",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            },
            {
                "input": "现在你拔剑向对方刺了过去, 对方闪都没有闪 空手接白刃,你的怒火更加旺盛",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            },
            {
                "input": "现在你剑被他控制了 你得做什么",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            },
            {
                "input": "恶霸不仅打人 而且骂人 他满嘴脏话",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            },
            {
                "input": "你已经落下风了,打不过 先骂回去",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            },
            {
                "input": "恶霸突然有些力不从心 没想到他向你求饶 真是个外强中干的家伙",
                "output": "作为律师,我必须要求您提供更多的信息和背景,以便我能够更好地理解您的情况并为您提供合适的建议。请告诉我您对该人的态度和原因,以及您希望我能够为您提供什么帮助。</s>"
            }
        ]
    },
    {
        "history": [
            {
                "input": "食堂有23个苹果,如果他们用了20个来做午餐并买了6个,他们现在有多少个苹果",
                "output": "根据题目描述,20个苹果被用来做午餐,因此只有10个苹果仍然存在。因此,现在他们有10个苹果和6个购买的苹果。综上所述,他们现在有16个苹果。</s>"
            },
            {
                "input": "食堂有33个苹果,如果他们用了10个来做午餐,3个坏了扔掉了,又买了5个,他们现在有多少个苹果",
                "output": "根据题目描述,10个苹果被用来做午餐,因此只有23个苹果仍然存在。因此,现在他们有23个苹果和5个购买的苹果。综上所述,他们现在有28个苹果。</s>"
            },
            {
                "input": "有若干只鸡和兔子,他们一共88个头,244个脚,鸡和兔一共有多少只",
                "output": "根据题目描述,鸡和兔一共有88个头,244个脚。因此,他们总共有332个肢体部位。综上所述,他们总共有332个肢体部位。</s>"
            },
            {
                "input": "桌子上有4个苹果,小红吃了1个,小刚拿走了2个,还剩下几个苹果?",
                "output": "根据题目描述,小红吃了1个苹果,小刚拿走了2个苹果,因此还剩下3个苹果。综上所述,桌子上还剩下3个苹果。</s>"
            },
            {
                "input": "从1加到101的总和是多少?",
                "output": "从1加到101的总和是506。简单地计算:\n\n1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 + 11 + 12 + 13 + 14 + 15 + 16 + 17 + 18 + 19 + 20 + 21 + 22 + 23 + 24 + 25 + 26 + 27 + 28 + 29 + 30 + 31 + 32 + 33 + 34 + 35 + 36 + 37 + 38 + 39 + 40 + 41 + 42 + 43 + 44 + 45 + 46 + 47 + 48 + 49 + 50 + 51 + 52 + 53 + 54 + 55 + 56 + 57 + 58 + 59 + 60 + 61 + 62 + 63 + 64 + 65 + 66 + 67 + 68 + 69 + 70 + 71 + 72 + 73 + 74 + 75 + 76 + 77 + 78 + 79 + 80 + 81 + 82 + 83 + 84 + 85 + 86 + 87 + 88 + 89 + 90 + 91 + 92 + 93 + 94 + 95 + 96 + 97 + 98 + 99 + 100 + 101 = 506</s>"
            },
            {
                "input": "计算2023年4月4日到国庆节一共有多少天,给出计算步骤。",
                "output": "要计算2023年4月4日到国庆节的天数,首先需要确定国庆节的开始日期和结束日期。国庆节的开始日期为2023年4月1日,结束日期为2023年4月5日。\n\n根据题目描述,需要计算2023年4月4日到国庆节的天数,因此需要计算2023年4月4日到2023年4月5日的天数。\n\n2023年4月4日到2023年4月5日的天数为2天。因此,2023年4月4日到国庆节的天数为2天。</s>"
            },
            {
                "input": "序列1,4,9,16的后一个数是什么?",
                "output": "序列1,4,9,16的后一个数是16。\n\n序列1,4,9,16的前两个数分别为1和4,后两个数分别为9和16,因此可以得出结论:1 + 4 + 9 + 16 = 20。</s>"
            }
        ]
    },
]
```


## 免责声明

此模型是基于大量语料库和算法模型进行训练的,并且在训练过程中可能存在偏差、错误和不完整的信息。因此,本项目提供的模型仅供参考和研究使用,作为领域数据微调的demo,并不能保证其准确性和可靠性,不能用于实际应用或决策。本项目不对使用预训练模型所产生的结果承担任何责任,也不对因使用预训练模型所产生的任何损失承担责任。使用者在使用预训练模型时应自行承担风险并进行自我验证。

---
类似项目:
- https://github.com/AndrewZhe/lawyer-llama
- https://github.com/NJU-LegalAI/Legal-ChatGLM