機器學習是專門用於使機器從觀察數據中學習的人工智能的一個分支,而無需明確編程。
機器學習和AI不一樣。機器學習是AI交響曲中的一種儀器,這是AI的組成部分。那麼,機器學習或ML到底是什麼?這是算法從先前數據中學習以產生行為的能力。 ML正在教學機器,以在他們從未見過的情況下做出決定。
該課程是為了指導您學習機器學習,推薦工具並通過建議媒體遵循的方式來擁抱ML生活方式。我會定期更新它,以保持新鮮感並擺脫過時的內容和棄用的工具。
研究本節以了解基本概念並發展直覺,然後再進行更深入的研究。
據說,計算機程序可以從經驗
E中學習一些類別的任務T和績效測量P如果P的t任務在T中的性能(通過P的任務)可以通過經驗E來提高。
建立一種感知環境的機器,然後選擇在任何給定狀態下採取的最佳政策(行動)以最大化其預期的長期標量獎勵是增強學習的目標。
深度學習是機器學習的一個分支,其中深人造神經網絡(DNN)(受神經元在大腦中的工作方式啟發的算法)通過結合多個人工神經元的多層來找到原始數據中的模式。隨著層次的增加,神經網絡學習越來越抽象的概念的能力也是如此。
最簡單的DNN是多層感知器(MLP)。

與普通DNN相比,使用網格數據(如聲波,圖像和視頻)的DNN。它們基於以下假設:附近的輸入單元比遙遠單元更相關。他們還利用翻譯不變性。例如,給定圖像,檢測圖像上各地的相同邊緣可能很有用。它們有時被稱為Convnets或CNN 。
具有州的DNN。他們還了解長度不同的序列。他們有時被稱為rnns 。
對於實用機器學習有用的庫和框架
機器學習構建塊
由於其出色的概括性能,在比賽中大量使用的模型。
時間序列數據需要獨特的功能提取過程,以便在大多數機器學習模型中可用,因為大多數模型都需要數據以表格格式。或者,您可以使用針對時間序列的特殊模型架構,例如LSTM,TCN,等。
幫助您開發/調試/部署模型在生產中(MLOP)的庫。除了訓練模型外,ML還有更多。
請記住,這是一個自以為是的列表。那裡有數十億個雲提供商。我不會列出所有這些。我只是要列出我熟悉的那些,我認為很好。
數據清潔和數據擴展
在開始之前,請閱讀此博客文章以了解一般搜索的動機:https://www.determined.ai/blog/stop-doing-iterative-titerative-model-development
睜開眼睛以進行搜索驅動的開發。它會改變你。主要好處是不會遇到挫折。只允許進度和改進。想像一下,每天都在工作和進步,而不是因為新解決方案不起作用,而不是向後退回。這種保證的進度是搜索驅動的開發對您的影響。將其應用於優化中的所有內容,而不僅僅是機器學習。
由於並行化(在許多機器上分佈式調諧),靈活性(可以優化任意目標並允許調諧數據集參數),SOTA調諧算法庫(例如,超級頻繁,bohb,bohb,bohb,bohb,pbt,pbt,asha等),我的最佳偏好是確定,射線調整和Optuna(在許多機器上分佈式調諧),靈活性(可以優化任意目標並允許調節數據集參數),結果可視化/分析/分析/分析工具。
讓機器學習,而無需進行功能工程,模型選擇和超參數調整的任務。讓機器為您執行機器學習!
就我個人而言,如果我有一個表格數據集,我會首先嘗試FLAML和MLJAR,尤其是如果您想快速工作時。如果您想嘗試梯度提升框架,例如XGBoost,LightGBM,Catboost等,但是您不知道哪種框架最有效,我建議您首先嘗試Automl,因為它將在內部嘗試前面提到的梯度增強框架。
在其領域最先進的體系結構。
timm 。大型語言模型(LLM)等GPT-3具有功能強大,但是需要提示它們生成所需的輸出。這是及時工程的地方。及時工程是設計提示的過程,可用於生成所需的輸出。
竊取智能計算機科學家引入的最新技術(可能是您)。
如果您是初學者,並且想開始我的建議,請閱讀此問題:#4
從現在開始,此列表將緊湊和對我自己的現實ML旅程的看法,我只會放置我認為對我和大多數人的真正有益的內容。所有不夠好(在任何方面)的材料和工具將逐漸刪除以應對信息超負荷,包括:
注意:每個鏈接沒有特定的等級。它們出現的順序沒有傳達任何含義,也不應以不同的方式對待。
或者,如果您沒有時間發送拉動請求,則可以提交一個新問題,其中包含您要我包含的資源。
您要包含的資源應該可以自由學習。