data science portfolio
1.0.0
我为学术,自我学习和爱好目的而完成的数据科学项目的存储库。以Jupyter笔记本和R Markdown文件的形式呈现(在RPUBS出版)。
有关浏览投资组合的视觉上更愉快的体验,请查看Sajalsharma.com
注意:项目中使用的数据(在数据目录中访问)仅用于演示目的。
工具:Scikit-Learn,Pandas,Seaborn,Matplotlib,Pygame
灾难消息分类器:一个多标签分类模型,可预测灾难消息的类别。包括用于数据处理的ETL管道,用于训练模型的ML管道以及具有可视化的Web应用程序,该模型可用于对消息进行分类。工具:NLTK,Scikit-Learn,Xgboost,Blask,Plotly
推文的3向情感分析:不使用NLTK的情感分析引擎的3向极性(正,负,中性)分类系统。
跨语言信息检索:跨语言信息检索系统(CLIR),鉴于德语查询,搜索用英语编写的文本文档。
工具:NLTK,Scikit
工具:熊猫,叶,海洋和matplotlib
Python
r
我还涉足所有其他类型的技术。您可以在这里找到一般的投资组合。
如果您喜欢所看到的内容,想与我聊天有关投资组合,工作机会或协作,请通过[email protected]拍摄电子邮件。
如果这个项目启发了您,给您自己的投资组合或帮助您的想法,请考虑给我买咖啡❤️。