
假設你是一位資料分析師,負責監測工業設備的健康狀態。
設備每天都在固定的周期模式下運轉,你希望找出潛在的異常,並預測設備的退化情況。
在這個情境下,固定周期特徵測試 (Fixed Cycle Features Test, FCFT) 提供了一種精簡但功能強大的方法,幫助你提取穩定狀態的訊號並進行深入分析。

驗證性資料分析(Confirmatory Data Analysis, CDA)是一種以假設為導向的資料分析方法,主要用於驗證或拒絕事前提出的假設。

在資料分析的世界裡,我們經常聽到「探索性資料分析(EDA)」這個詞,但其實在真正進入嚴謹的統計推論之前,有一個更具系統性的步驟,那就是「驗證性資料分析」(Confirmatory Data Analysis, CDA)。這篇文章將帶你從概念出發,理解 CDA 的定位與用途,並說明它在資料科學與研究中的重要性。

在資料分析領域當中,我們在最初會探索資料特徵之間的關聯性,而資料特徵的主要類別為連續型資料以及類別型資料,本篇文章當中所提到的皮爾森相關係數(Pearson Correlation Coefficient),是用來估計兩個連續型資料資料之間的線性關係,用以比較它們的關係程度。
-768x432.png)
分群分布圖(Cluster Distribution Plot)是在商業分析當中,一種常見的視覺化分群分析工具,主要用於顯示資料集當中的不同群體(clusters)以及其分佈情況。
我們可以利用此圖表幫助我們理解資料分群當中隱含的結構資訊,用以辨識不同群體當中具有相似性和差異性的部分。

目標達成率圖是一種商業圖表的呈現方式,主要用來顯示實際表現與預設目標之間的關係。
通常用於比較實際數據(如銷售額、客戶留存率等)與預期目標,能夠幫助團隊快速識別哪些目標已經達成、尚未達成,或是達成程度的狀態。

在商業領域中,許多的業務推行和決策往往需要多加考慮在進行決策的調整,調整的目的不外乎是希望提升業務收入,或者降低成本,本篇內容將介紹收益成本分析圖(Profit-Cost Curve),讓機器學習模型在訓練的同時,就自動幫我們評估好模型最佳閾值(threshold),能夠讓業務推行的同時,在收益與成本的管控上取得更好的平衡。

很多時候我們在網路上看到有關軟體開發的教學文章,都會事先呈現撰寫程式的資料夾目錄,尤其是越大型的專案開發,越需要更加明確的專案目錄進行規劃,下面麥特會介紹使用計種不同方法將專案目錄呈現出來的方式,不管是在學校的專題報告、工作報告,甚至是軟體開發的教學文章,都可以讓人更加容易的理解其專案目錄的內容唷!

在機器學習領域當中,有效的理解模型的偏差(Bias)和變異數(Variance)是一種分析和理解模型泛化誤差(generalization error)技術的一中方式,經由判斷出誤差的類型,我們可以更有信心的調整資料特徵以及模型超參數的設定。

李亞普諾夫指數是一個在數學領域中,用於量化動態系統中相鄰軌跡隨時間的分離率。

Hoeffding 不等式(Hoeffding’s Inequality)是一個經典的概率不等式,用於分析二元隨機變量和的偏離程度。在機器學習中,它可以幫助估計模型的泛化誤差(Generalization Error),也就是模型在訓練集上的表現與在測試集上的表現的差異。
