Recognizers Text
v1.8.10
Microsoft.Recognizers.TEXT提供了对数字,单位和日期/时间等实体的强大识别和解决;用多种语言表达。全力支持中国,英语,法语,西班牙,葡萄牙语,德国,意大利语,土耳其语,印地语和荷兰语。对日本,韩国,阿拉伯语和瑞典语的部分支持。更多。
Microsoft.Recognizers.Text为Luis中的预构建实体提供权力:了解智能服务, Power Virtual Agents和Microsoft Bot框架;文本分析认知服务中的基本实体类型;它也可以作为独立软件包(用于基类和不同实体识别者)的独立软件包。
Microsoft.Recognizers.Text软件包当前针对四个平台:
非常欢迎捐款!用于当前支持的语言的修复和扩展,并扩展到新的语言。特别是对于日本,韩国,阿拉伯语,瑞典语和其他人!下面的更多信息。
.NET是主要软件包版本,随着时间的推移,贡献向其他平台传播。
如果您在学术工程中使用识别者,请在下面引用它(如果相关,则可以省略版本号或将其更新为特定版本):
@software{soft:recognizers-text,
author = {Wenhao Huang and Zijia Lin and Chris McConnell and B{ " {o}}rje F. Karlsson},
title = {{Recognizers-Text}: {R}ecognition and resolution of numbers, units, and date/time entities expressed across multiple languages},
month = jul,
year = 2017,
publisher = {Zenodo},
version = {1.0.0},
doi = {10.5281/zenodo.6860598},
url = {https://doi.org/10.5281/zenodo.6860598}
}如果更好地适合您的模板,请随时将“ @software”更改为“ @misc”。
如果您有任何疑问,即使不是实际的错误,请继续并打开问题。问题也是一个可接受的讨论论坛。
该项目采用了Microsoft开源的行为代码。有关更多信息,请参见《行为守则常见问题守则》或与其他问题或评论联系[email protected]。
贡献的好起点是:
help wanted问题);NotSupported (Specs);和下面的链接描述了项目结构,并提供了有关如何贡献的概述和技巧(尽管某些步骤可能已经过时了)。谢谢你!
下表总结了当前支持的实体。对英语的支持通常比其他人更完整。主要平台为.NET(如表所示),并且支持应传播给其他人。
| 实体类型 | en | ZH-CN | NL | fr | de | 它 | JA | ko | pt | es |
|---|---|---|---|---|---|---|---|---|---|---|
| 号码(红衣主教) | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
| 序数 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
| 百分比 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
| 数字范围 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | PA/EO | ✓ | ✓ | ✓ |
| 单位 - 年龄 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | PA/EO | ✓ | ✓ |
| 单位 - 货币 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | PA/EO | ✓ | ✓ |
| 单位 - 尺寸 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | PA/EO | ✓ | ✓ |
| 单位 - 温度 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
| 选择 - 布尔 | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | 所以 | ✓ | ✓ |
| seq。 - 电子邮件 | g | g* | g | g | g | g | g* | g* | g | g |
| seq。 - 指南 | g | g | g | g | g | g | g | g | g | g |
| seq。 - 社会的 | g | g | g | g | g | g | g | g | g | g |
| seq。 -IP地址 | g | g | g | g | g | g | g | g | g | g |
| seq。 - 电话号码 | g | g | g | g | g | g | g | g | g | g |
| seq。 - URL | g | g* | g | g | g | g | g* | g* | g | g |
| DateTime(+亚型) | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | 所以 | ✓ | ✓ |
| 实体类型 | SV | BG | tr | 你好 | ar | |||||
|---|---|---|---|---|---|---|---|---|---|---|
| 号码(红衣主教) | ✓ | ✓ | ✓ | PA/EO | ||||||
| 序数 | ✓ | ✓ | ✓ | PA/EO | ||||||
| 百分比 | ✓ | ✓ | ✓ | PA/EO | ||||||
| 数字范围 | ✓ | ✓ | PA/EO | |||||||
| 单位 - 年龄 | ✓ | ✓ | ✓ | |||||||
| 单位 - 货币 | ✓ | ✓ | ✓ | |||||||
| 单位 - 尺寸 | ✓ | ✓ | ✓ | |||||||
| 单位 - 温度 | ✓ | ✓ | ✓ | |||||||
| 选择 - 布尔 | ✓ | ✓ | ✓ | ✓ | ✓ | |||||
| seq。 - 电子邮件 | g | g | g | g | g | |||||
| seq。 - 指南 | g | g | g | g | g | |||||
| seq。 - 社会的 | g | g | g | g | g | |||||
| seq。 -IP地址 | g | g | g | g | g | |||||
| seq。 - 电话号码 | ||||||||||
| seq。 - URL | g | g | g | g* | g* | |||||
| DateTime(+亚型) | sp | ✓ | ✓ | 所以 |