sentimentのダウンロード - sentimentメントソースコードのダウンロード

sentiment

その他のソースコード

v0.2.1

ダウンロード

感情

node.jsのアフィンベースの感情分析

Sentimentは、Afinn-165 WordListとEmoji Sentimentランキングを使用して、入力テキストの任意のブロックでセンチメント分析を実行するnode.jsモジュールです。感情はいくつかのことを提供します：

パフォーマンス（以下のベンチマークを参照）
Afinn WordListから単語 /値のペアを追加および上書きする機能
新しい言語のサポートを簡単に追加する機能
言語ごとに否定、強調などのカスタム戦略を簡単に定義する能力

インストール

npm install sentiment

使用例

 var Sentiment = require ( 'sentiment' ) ;
var sentiment = new Sentiment ( ) ;
var result = sentiment . analyze ( 'Cats are stupid.' ) ;
console . dir ( result ) ;    // Score: -2, Comparative: -0.666

新しい言語の追加

registerLanguageメソッドを使用して登録することにより、新しい言語のサポートを追加できます。

 var frLanguage = {
  labels : { 'stupide' : - 2 }
} ;
sentiment . registerLanguage ( 'fr' , frLanguage ) ;

var result = sentiment . analyze ( 'Le chat est stupide.' , { language : 'fr' } ) ;
console . dir ( result ) ;    // Score: -2, Comparative: -0.5

また、否定や言語ごとの強調などを処理するカスタムスコアリング戦略を定義することもできます。

 var frLanguage = {
  labels : { 'stupide' : - 2 } ,
  scoringStrategy : {
    apply : function ( tokens , cursor , tokenScore ) {
      if ( cursor > 0 ) {
        var prevtoken = tokens [ cursor - 1 ] ;
        if ( prevtoken === 'pas' ) {
          tokenScore = - tokenScore ;
        }
      }
      return tokenScore ;
    }
  }
} ;
sentiment . registerLanguage ( 'fr' , frLanguage ) ;

var result = sentiment . analyze ( 'Le chat n'est pas stupide' , { language : 'fr' } ) ;
console . dir ( result ) ;    // Score: 2, Comparative: 0.4

単語の追加と上書き

キー/値のペアをセンチメントメソッドコールに単純に注入するだけで、Afinnから値を追加および/または上書きすることができます。

 var options = {
  extras : {
    'cats' : 5 ,
    'amazing' : 2
  }
} ;
var result = sentiment . analyze ( 'Cats are totally amazing!' , options ) ;
console . dir ( result ) ;    // Score: 7, Comparative: 1.75

APIリファレンス

`var sentiment = new Sentiment([options])`

口論	タイプ	必須	説明
オプション	`object`	`false`	構成オプション（現在サポートされているオプションはありません）

`sentiment.analyze(phrase, [options], [callback])`

口論	タイプ	必須	説明
フレーズ	`string`	`true`	分析する入力フレーズ
オプション	`object`	`false`	オプション（以下を参照）
折り返し電話	`function`	`false`	指定した場合、このコールバック関数を使用して結果が返されます

optionsオブジェクトプロパティ：

財産	タイプ	デフォルト	説明
言語	`string`	`'en'`	感情分析に使用する言語
エキストラ	`object`	`{}`	追加または上書きするためのラベルのセットとそれに関連する値

`sentiment.registerLanguage(languageCode, language)`

口論	タイプ	必須	説明
languagecode	`string`	`true`	追加する言語の国際的な2桁のコード
言語	`object`	`true`	言語モジュール（新しい言語の追加を参照）

それがどのように機能するか

アフィン

アフィンは、マイナス5（負）とプラス5（ポジティブ）の間の整数を持つ価数と評価された単語のリストです。センチメント分析は、弦トークン（単語、絵文字）をAfinnリストでクロスチェックし、それぞれのスコアを取得することにより実行されます。比較スコアは単純です： sum of each token / number of tokens 。たとえば、以下を取りましょう。

I love cats, but I am allergic to them.

その文字列の結果は次のとおりです。

 {
    score : 1 ,
    comparative : 0.1111111111111111 ,
    calculation : [ { allergic : - 2 } , { love : 3 } ] ,
    tokens : [
        'i' ,
        'love' ,
        'cats' ,
        'but' ,
        'i' ,
        'am' ,
        'allergic' ,
        'to' ,
        'them'
    ] ,
    words : [
        'allergic' ,
        'love'
    ] ,
    positive : [
        'love'
    ] ,
    negative : [
        'allergic'
    ]
}

返されたオブジェクト
- スコア：認識された単語の感情値を追加することによって計算されたスコア。
- 比較：入力文字列の比較スコア。
- 計算：それぞれのAfinnスコアでネガティブまたはポジティブな価値を持つ単語の配列。
- トークン：入力文字列にある単語や絵文字のようなすべてのトークン。
- 単語：Afinnリストにある入力文字列からの単語のリスト。
- 肯定的：Afinnリストで見つかった入力文字列の肯定的な単語のリスト。
- ネガティブ：Afinnリストにある入力文字列の否定的な単語のリスト。

この場合、愛の値は3、アレルギーの値は-2、残りのトークンは0の値で中立です。文字列には9トークンがあるため、結果の比較スコアは次のようになります。 (3 + -2) / 9 = 0.111111111

このアプローチは、0の中間点が残り、上限と下限はそれぞれ正と負の5に制約されます（各トークンと同じ！？）。たとえば、200トークンを備えた信じられないほど「ポジティブな」文字列と、各トークンのアフィンスコアが5の想像してみましょう。結果の比較スコアは次のようになります。

 (max positive score * number of tokens) / number of tokens
(5 * 200) / 200 = 5

トークン化

トークン化は、入力文字列の行を分割し、特殊文字を削除し、最終的にスペースを使用して分割することで機能します。これは、文字列内の単語のリストを取得するために使用されます。

ベンチマーク

sentimentを設計するための主な動機はパフォーマンスでした。そのため、ほぼ同等のインターフェイスとアプローチを提供するセンチメンタルモジュールと比較するテストディレクトリ内のベンチマークスクリプトが含まれています。これらのベンチマークに基づいて、ノードv6.9.1を備えたMacBook Proで実行されているため、 sentiment代替実装のほぼ2倍の速さです。

sentiment (Latest) x 861,312 ops/sec ±0.87% (89 runs sampled)
Sentimental (1.0.1) x 451,066 ops/sec ±0.99% (92 runs sampled)

ベンチマークを自分で実行するには：

npm run test:benchmark

検証

Afinnが提供する精度は、計算パフォーマンス（上記参照）であることを考えると非常に良いことですが、常に改善の余地があります。したがって、 sentimentモジュールは、精度を改善し、同様のパフォーマンス特性を維持することを考慮して、Afin / emojiデータセットまたは実装を変更または修正するPRを受け入れることに開放されています。これを確立するために、UCIが提供する3つのラベル付きデータセットに対してsentimentモジュールをテストします。

自分で検証テストを実行するには：

npm run test:validate

ランドの精度

 Amazon:  0.726
IMDB:    0.765
Yelp:    0.696

テスト

npm test

拡大する

追加情報

バージョン v0.2.1
タイプその他のソースコード
更新時間 2025-04-17
サイズ 151.45KB
から Github

sentiment

感情

node.jsのアフィンベースの感情分析

目次

インストール

使用例

新しい言語の追加

単語の追加と上書き

APIリファレンス

`var sentiment = new Sentiment([options])`

`sentiment.analyze(phrase, [options], [callback])`

`sentiment.registerLanguage(languageCode, language)`

それがどのように機能するか

アフィン

トークン化

ベンチマーク

検証

ランドの精度

テスト

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express