Rasa NLU (ความเข้าใจภาษาธรรมชาติ) เป็นเครื่องมือในการทำความเข้าใจความหมายตามธรรมชาติ ตัวอย่างเช่นเว็บไซต์ทางการมีดังนี้:
"ฉันกำลังมองหาร้านอาหารเม็กซิกันในใจกลางเมือง"
และส่งคืนข้อมูลที่มีโครงสร้างเช่น:
intent: search_restaurant
entities:
- cuisine : Mexican
- location : center
โครงการดั้งเดิมอยู่ในสาขา 0.2.7 และสามารถเปลี่ยนได้อย่างอิสระ การดัดแปลงของเวอร์ชันนี้ขึ้นอยู่กับ RASA เวอร์ชันล่าสุด ส่วนประกอบดั้งเดิมใน RASA_NLU_GAO ได้รับการแก้ไขและไม่มีการเพิ่มเติมใหม่ ยิ่งไปกว่านั้นการปฏิบัติก่อนหน้านี้ค่อนข้างยุ่งยากและไม่จำเป็นต้องแก้ไขในซอร์สโค้ด RASA คุณสามารถโหลดส่วนประกอบดั้งเดิมโดยตรงเป็น addon สืบทอด RASA เวอร์ชันล่าสุดและอัปเดตตามเวลาจริง
ฟีเจอร์ใหม่ที่เพิ่มเข้ามามีดังนี้ (โปรดดาวน์โหลดเวอร์ชัน Rasa-Nlu-Gao ล่าสุด) (แก้ไขที่ 2019.06.24):
language: "zh"
pipeline:
- name: "JiebaTokenizer"
- name: "CountVectorsFeaturizer"
token_pattern: "(?u)bw+b"
- name: "EmbeddingIntentClassifier"
- name: "rasa_nlu_gao.extractors.bilstm_crf_entity_extractor.BilstmCRFEntityExtractor"
lr: 0.001
char_dim: 100
lstm_dim: 100
batches_per_epoch: 10
seg_dim: 20
num_segs: 4
batch_size: 200
tag_schema: "iobes"
model_type: "bilstm" # 模型支持两种idcnn膨胀卷积模型或bilstm双向lstm模型
clip: 5
optimizer: "adam"
dropout_keep: 0.5
steps_check: 100
language: "zh"
pipeline:
- name: "JiebaTokenizer"
- name: "CRFEntityExtractor"
- name: "rasa_nlu_gao.extractors.jieba_pseg_extractor.JiebaPsegExtractor"
part_of_speech: ["nr", "ns", "nt"]
- name: "CountVectorsFeaturizer"
OOV_token: oov
token_pattern: "(?u)bw+b"
- name: "EmbeddingIntentClassifier"
language: "zh"
pipeline:
- name: "JiebaTokenizer"
- name: "CRFEntityExtractor"
- name: "JiebaPsegExtractor"
- name: "CountVectorsFeaturizer"
OOV_token: oov
token_pattern: '(?u)bw+b'
- name: "EmbeddingIntentClassifier"
- name: "rasa_nlu_gao.classifiers.entity_edit_intent.EntityEditIntent"
entity: ["nr"]
intent: ["enter_data"]
min_confidence: 0
language: "zh"
pipeline:
- name: "JiebaTokenizer"
- name: "rasa_nlu_gao.featurizers.bert_vectors_featurizer.BertVectorsFeaturizer"
ip: '127.0.0.1'
port: 5555
port_out: 5556
show_server_config: True
timeout: 10000
- name: "EmbeddingIntentClassifier"
- name: "CRFEntityExtractor"
EmbeddingIntentClassifier และ ner_bilstm_crf ส่วนประกอบสองส่วนที่ใช้ TensorFlow ได้รับการกำหนดค่าดังต่อไปนี้ (แน่นอน config_proto ไม่สามารถกำหนดค่าและค่าเริ่มต้นจะใช้ทรัพยากรทั้งหมด): language: "zh"
pipeline:
- name: "JiebaTokenizer"
- name: "CountVectorsFeaturizer"
token_pattern: '(?u)bw+b'
- name: "EmbeddingIntentClassifier"
config_proto: {
"device_count": 4,
"inter_op_parallelism_threads": 0,
"intra_op_parallelism_threads": 0,
"allow_growth": True
}
- name: "rasa_nlu_gao.extractors.bilstm_crf_entity_extractor.BilstmCRFEntityExtractor"
config_proto: {
"device_count": 4,
"inter_op_parallelism_threads": 0,
"intra_op_parallelism_threads": 0,
"allow_growth": True
}
embedding_bert_intent_classifier และไฟล์การกำหนดค่าที่เกี่ยวข้องมีดังนี้: language: "zh"
pipeline:
- name: "JiebaTokenizer"
- name: "rasa_nlu_gao.featurizers.bert_vectors_featurizer.BertVectorsFeaturizer"
ip: '127.0.0.1'
port: 5555
port_out: 5556
show_server_config: True
timeout: 10000
- name: "rasa_nlu_gao.classifiers.embedding_bert_intent_classifier.EmbeddingBertIntentClassifier"
- name: "CRFEntityExtractor"
intent_estimator_classifier_tensorflow_embedding_bert classifier language: "zh"
pipeline:
- name: "JiebaTokenizer"
- name: "rasa_nlu_gao.featurizers.bert_vectors_featurizer.BertVectorsFeaturizer"
ip: '127.0.0.1'
port: 5555
port_out: 5556
show_server_config: True
timeout: 10000
- name: "rasa_nlu_gao.classifiers.embedding_bert_intent_estimator_classifier.EmbeddingBertIntentEstimatorClassifier"
- name: "SpacyNLP"
- name: "CRFEntityExtractor"
pip install rasa-nlu-gao
สำหรับตัวอย่างเฉพาะโปรดดู rasa_chatbot_cn
LivePortraitweb novelling whatnovel omniparser sexting imprimp4