
驗證性資料分析(Confirmatory Data Analysis, CDA)是一種以假設為導向的資料分析方法,主要用於驗證或拒絕事前提出的假設。

TPOT (Tree-based Pipeline Optimization Tool) 是一個自動化機器學習(AutoML)的 Python 工具,主要是希望簡化機器學習模型的建模過程,TPOT利用遺傳編程來自動設計和優化機器學習管道,讓非專業的資料科學研究人員也能輕鬆使用機器學習技術。

在建立機器學習模型之前,針對不同的預測目標,會有不同類型的機器學習模型,主要分成三大類型,分別是...

在進行資料分析之前,最重要的就是釐清自己的研究流程,簡單的介紹資料分析與機器學習會使用到的研究流程,讓大家可以清楚知道自己的分析步驟,並說明兩種研究上的相同與相異處,在完成了第一次的流程之後,也能視自己的需求在不同的環節進行優化唷!