アカデミック、セルフラーニング、趣味の目的で私によって完了したデータサイエンスプロジェクトのポートフォリオを含むリポジトリ。 Jupyterノートブックの形式で提示され、R Markdownファイル(RPUBSで公開)。
ポートフォリオを閲覧するためのより視覚的に快適な体験については、sajalsharma.comをご覧ください
注:プロジェクトで使用されるデータ(データディレクトリでアクセス)は、デモンストレーションのみを目的としています。
ツール:Scikit-Learn、Pandas、Seaborn、Matplotlib、Pygame
災害メッセージ分類器:災害メッセージのカテゴリを予測するためのマルチサーベル分類モデル。データ処理用のETLパイプライン、モデルをトレーニングするためのMLパイプライン、および視覚化を備えたWebアプリが含まれています。ここでは、モデルを使用してメッセージを分類できます。ツール:NLTK、SCIKIT-LEARN、XGBOOST、FLASK、PLOTLY
ツイートの3ウェイセンチメント分析:NLTKのセンチメント分析エンジンを使用せずに、ツイートの3方向極性(陽性、負、ニュートラル)分類システム。
クロス言語情報検索:クロス言語情報検索システム(CLIR)は、ドイツ語でクエリを与えられて、英語で書かれたテキスト文書を検索します。
ツール:NLTK、Scikit
ツール:Pandas、Folium、Seaborn、Matplotlib
Python
r
また、他のあらゆる種類のテクノロジーにも手を出しています。ここで一般的なポートフォリオを見つけることができます。
見たものが気に入った場合は、ポートフォリオ、仕事の機会、またはコラボレーションについて私とチャットしたい場合は、[email protected]でメールを撮影してください。
このプロジェクトがあなたにインスピレーションを与えたり、あなた自身のポートフォリオのアイデアを与えたり、助けてくれたなら、私にコーヒーを買うことを検討してください❤️。