ดาวน์โหลด sentiment - ดาวน์โหลดซอร์สโค้ด sentiment

sentiment

ซอร์สโค้ดอื่น ๆ

v0.2.1

ดาวน์โหลด

ความเชื่อมั่น

การวิเคราะห์ความเชื่อมั่นตาม Afinn สำหรับ node.js

ความเชื่อมั่นคือโมดูล Node.js ที่ใช้การจัดอันดับความเชื่อมั่น Afinn-165 WordList และ Emoji เพื่อทำการวิเคราะห์ความเชื่อมั่นในบล็อกโดยพลการของข้อความอินพุต ความเชื่อมั่นให้หลายสิ่ง:

ประสิทธิภาพ (ดูเกณฑ์มาตรฐานด้านล่าง)
ความสามารถในการผนวกและเขียนทับคำ / ค่าคู่จาก Afinn WordList
ความสามารถในการเพิ่มการสนับสนุนสำหรับภาษาใหม่ได้อย่างง่ายดาย
ความสามารถในการกำหนดกลยุทธ์ที่กำหนดเองสำหรับการปฏิเสธการเน้น ฯลฯ ได้อย่างง่ายดายในแต่ละภาษา

สารบัญ

การติดตั้ง
ตัวอย่างการใช้งาน
การเพิ่มภาษาใหม่
การเพิ่มและเขียนทับคำ
การอ้างอิง API
มันทำงานอย่างไร
เกณฑ์มาตรฐาน
การตรวจสอบความถูกต้อง
การทดสอบ

การติดตั้ง

npm install sentiment

ตัวอย่างการใช้งาน

 var Sentiment = require ( 'sentiment' ) ;
var sentiment = new Sentiment ( ) ;
var result = sentiment . analyze ( 'Cats are stupid.' ) ;
console . dir ( result ) ;    // Score: -2, Comparative: -0.666

การเพิ่มภาษาใหม่

คุณสามารถเพิ่มการสนับสนุนสำหรับภาษาใหม่โดยการลงทะเบียนโดยใช้วิธี registerLanguage :

 var frLanguage = {
  labels : { 'stupide' : - 2 }
} ;
sentiment . registerLanguage ( 'fr' , frLanguage ) ;

var result = sentiment . analyze ( 'Le chat est stupide.' , { language : 'fr' } ) ;
console . dir ( result ) ;    // Score: -2, Comparative: -0.5

นอกจากนี้คุณยังสามารถกำหนดกลยุทธ์การให้คะแนนแบบกำหนดเองเพื่อจัดการกับสิ่งต่าง ๆ เช่นการปฏิเสธและการเน้นเป็นภาษาต่อภาษา:

 var frLanguage = {
  labels : { 'stupide' : - 2 } ,
  scoringStrategy : {
    apply : function ( tokens , cursor , tokenScore ) {
      if ( cursor > 0 ) {
        var prevtoken = tokens [ cursor - 1 ] ;
        if ( prevtoken === 'pas' ) {
          tokenScore = - tokenScore ;
        }
      }
      return tokenScore ;
    }
  }
} ;
sentiment . registerLanguage ( 'fr' , frLanguage ) ;

var result = sentiment . analyze ( 'Le chat n'est pas stupide' , { language : 'fr' } ) ;
console . dir ( result ) ;    // Score: 2, Comparative: 0.4

การเพิ่มและเขียนทับคำ

คุณสามารถผนวกและ/หรือเขียนทับค่าจาก AFINN ได้โดยเพียงแค่ฉีดคู่คีย์/ค่าลงในการโทรวิธีความเชื่อมั่น:

 var options = {
  extras : {
    'cats' : 5 ,
    'amazing' : 2
  }
} ;
var result = sentiment . analyze ( 'Cats are totally amazing!' , options ) ;
console . dir ( result ) ;    // Score: 7, Comparative: 1.75

การอ้างอิง API

`var sentiment = new Sentiment([options])`

การโต้แย้ง	พิมพ์	ที่จำเป็น	คำอธิบาย
ตัวเลือก	`object`	`false`	ตัวเลือกการกำหนดค่า (ไม่รองรับตัวเลือกในปัจจุบัน)

`sentiment.analyze(phrase, [options], [callback])`

การโต้แย้ง	พิมพ์	ที่จำเป็น	คำอธิบาย
วลี	`string`	`true`	วลีอินพุตเพื่อวิเคราะห์
ตัวเลือก	`object`	`false`	ตัวเลือก (ดูด้านล่าง)
การโทรกลับ	`function`	`false`	หากระบุผลลัพธ์จะถูกส่งคืนโดยใช้ฟังก์ชันการโทรกลับนี้

คุณสมบัติวัตถุตัว options :

คุณสมบัติ	พิมพ์	ค่าเริ่มต้น	คำอธิบาย
ภาษา	`string`	`'en'`	ภาษาที่ใช้สำหรับการวิเคราะห์ความเชื่อมั่น
ความพิเศษ	`object`	`{}`	ชุดป้ายกำกับและค่าที่เกี่ยวข้องเพื่อเพิ่มหรือเขียนทับ

`sentiment.registerLanguage(languageCode, language)`

การโต้แย้ง	พิมพ์	ที่จำเป็น	คำอธิบาย
Languagecode	`string`	`true`	รหัสสองหลักระหว่างประเทศสำหรับภาษาที่จะเพิ่ม
ภาษา	`object`	`true`	โมดูลภาษา (ดูการเพิ่มภาษาใหม่)

มันทำงานอย่างไร

อึกทึกครึกโครม

Afinn เป็นรายการของคำที่ได้รับการจัดอันดับสำหรับวาเลนซ์ที่มีจำนวนเต็มระหว่างลบห้า (ลบ) และบวกห้า (บวก) การวิเคราะห์ความเชื่อมั่นดำเนินการโดยการตรวจสอบข้ามโทเค็นสตริง (คำ, อิโมจิ) กับรายการ AFINN และรับคะแนนตามลำดับ คะแนนเปรียบเทียบเป็นเพียง: sum of each token / number of tokens ตัวอย่างเช่นลองใช้สิ่งต่อไปนี้:

I love cats, but I am allergic to them.

สตริงนั้นส่งผลให้ดังต่อไปนี้:

 {
    score : 1 ,
    comparative : 0.1111111111111111 ,
    calculation : [ { allergic : - 2 } , { love : 3 } ] ,
    tokens : [
        'i' ,
        'love' ,
        'cats' ,
        'but' ,
        'i' ,
        'am' ,
        'allergic' ,
        'to' ,
        'them'
    ] ,
    words : [
        'allergic' ,
        'love'
    ] ,
    positive : [
        'love'
    ] ,
    negative : [
        'allergic'
    ]
}

วัตถุที่ส่งคืน
- คะแนน : คะแนนคำนวณโดยการเพิ่มค่าความเชื่อมั่นของคำที่รู้จัก
- เปรียบเทียบ : คะแนนเปรียบเทียบของสตริงอินพุต
- การคำนวณ : อาร์เรย์ของคำที่มีความสามารถเชิงลบหรือบวกกับคะแนน AFINN ที่เกี่ยวข้อง
- โทเค็น : โทเค็นทั้งหมดเช่นคำหรืออิโมจิที่พบในสตริงอินพุต
- คำ : รายการคำจากสตริงอินพุตที่พบในรายการ Afinn
- บวก : รายการคำบวกในสตริงอินพุตที่พบในรายการ AFINN
- ลบ : รายการคำลบในสตริงอินพุตที่พบในรายการ AFINN

ในกรณีนี้ความรักมีค่า 3, แพ้มีค่า -2 และโทเค็นที่เหลือเป็นกลางโดยมีค่า 0 เนื่องจากสตริงมีโทเค็น 9 โทเค็นคะแนนเปรียบเทียบที่เกิดขึ้นดูเหมือน: (3 + -2) / 9 = 0.111111111

วิธีการนี้ทำให้คุณมีจุดกึ่งกลาง 0 และขอบเขตบนและล่างถูก จำกัด ให้เป็นบวกและลบ 5 ตามลำดับ (เช่นเดียวกับแต่ละโทเค็น!?) ตัวอย่างเช่นลองจินตนาการถึงสตริง "บวก" อย่างไม่น่าเชื่อที่มีโทเค็น 200 และที่โทเค็นแต่ละตัวมีคะแนน Afinn 5 คะแนนการเปรียบเทียบที่เกิดขึ้นของเราจะมีลักษณะเช่นนี้:

 (max positive score * number of tokens) / number of tokens
(5 * 200) / 200 = 5

การทำให้โทเค็น

Tokenization ทำงานได้โดยการแยกสายของสตริงอินพุตจากนั้นลบอักขระพิเศษและในที่สุดก็แยกมันโดยใช้ช่องว่าง สิ่งนี้ใช้เพื่อรับรายการคำในสตริง

เกณฑ์มาตรฐาน

แรงจูงใจหลักสำหรับการออกแบบ sentiment คือประสิทธิภาพ ดังนั้นจึงมีสคริปต์มาตรฐานภายในไดเรกทอรีทดสอบที่เปรียบเทียบกับโมดูลอารมณ์ซึ่งให้อินเทอร์เฟซและวิธีการที่เทียบเท่ากัน ตามมาตรฐานเหล่านี้การทำงานบน MacBook Pro ด้วย Node V6.9.1 sentiment มั่นเกือบสองเท่าเร็วเท่ากับการใช้งานทางเลือก:

sentiment (Latest) x 861,312 ops/sec ±0.87% (89 runs sampled)
Sentimental (1.0.1) x 451,066 ops/sec ±0.99% (92 runs sampled)

เพื่อเรียกใช้เกณฑ์มาตรฐานด้วยตัวเอง:

npm run test:benchmark

การตรวจสอบความถูกต้อง

ในขณะที่ความแม่นยำที่จัดทำโดย Afinn นั้นค่อนข้างดีเมื่อพิจารณาถึงประสิทธิภาพการคำนวณ (ดูด้านบน) มีที่ว่างสำหรับการปรับปรุงอยู่เสมอ ดังนั้นโมดูล sentiment จึงเปิดให้ยอมรับ PRS ซึ่งแก้ไขหรือแก้ไขชุดข้อมูล AFINN / EMOJI หรือการใช้งานเนื่องจากพวกเขาปรับปรุงความแม่นยำและรักษาลักษณะประสิทธิภาพที่คล้ายกัน เพื่อสร้างสิ่งนี้เราทดสอบโมดูล sentiment มั่นกับชุดข้อมูลที่มีป้ายกำกับสามชุดที่จัดทำโดย UCI

เพื่อเรียกใช้การทดสอบการตรวจสอบตัวเอง:

npm run test:validate

ความแม่นยำของแรนด์

 Amazon:  0.726
IMDB:    0.765
Yelp:    0.696

การทดสอบ

npm test

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน v0.2.1
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-04-17
ขนาด 151.45KB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด