97夜夜澡人人爽人人,国内精品自产拍在线观看,年轻的女士2在线观看,两个人看的www视频,奇米综合四色77777久久

軟件介紹

軟件標簽: weka 數據挖掘

weka中文版官方最新版是一款非常實用的數據挖掘軟件，這款軟件廣泛應用于SQL數據庫領用，下面有綠色資源網小編為您帶來weka中文版32位/64位官網最新版下載，需要的朋友歡迎來本站免費下載使用。

WEKA中文版官方介紹

WEKA的全名是懷卡托智能分析環境（Waikato Environment for Knowledge Analysis），同時weka也是新西蘭的一種鳥名，而WEKA的主要開發者來自新西蘭。

Weka是一款開源的、非商業性質的免費數據挖掘軟件，集合了大量能承擔數據挖掘任務的計算機學習算法，包括對數據進行預處理、分類、回歸、聚類、關聯規則以及在新的交互界面上的可視化。數據挖掘軟件Weka的技術基于假設數據是以一種單個文件或關聯的，在那里，每個數據點都被許多屬性標注。

Weka使用Java的數據庫鏈接能力可以訪問SQL數據庫，并可以處理一個數據庫的查詢結果。它主要的用戶接品是Explorer，也同樣支持相同功能的命令行，或是一種基于組件的知識流接口。如果想自己實現數據挖掘算法的話，可以看一下Weka的接口文檔，在Weka 中集成自己的算法甚至借鑒它的方法自己實現可視化工具并不是一件很困難的事情。

weka中文版官方最新版

WEKA背景知識

WEKA把分類(Classification)和回歸(Regression)都放在“Classify”選項卡中，這是有原因的。

在這兩個任務中，都有一個目標屬性（輸出變量）。我們希望根據一個樣本(WEKA中稱作實例)的一組特征（輸入變量），對目標進行預測。為了實現這一目的，我們需要有一個訓練數據集，這個數據集中每個實例的輸入和輸出都是已知的。觀察訓練集中的實例，可以建立起預測的模型。有了這個模型，我們就可以新的輸出未知的實例進行預測了。衡量模型的好壞就在于預測的準確程度。

在WEKA中，待預測的目標（輸出）被稱作Class屬性，這應該是來自分類任務的“類”。一般的，若Class屬性是分類型時我們的任務才叫分類，Class屬性是數值型時我們的任務叫回歸。

WEKA漢化版參數設置

現在我們計劃挖掘出支持度在10%到100%之間，并且lift值超過1.5且lift值排在前100位的那些關聯規則。我們把 “lowerBoundMinSupport”和“upperBoundMinSupport”分別設為0.1和1，“metricType”設為 lift，“minMetric”設為1.5，“numRules”設為100。其他選項保持默認即可。“OK” 之后在“Explorer”中點擊“Start”開始運行算法，在右邊窗口顯示數據集摘要和挖掘結果。

下面是挖掘出來的lift排前5的規則。

Best rules found:

1. age=52_max save_act=YES current_act=YES 113 ==> income=43759_max 61 conf:(0.54) < lift:(4.05)> lev:(0.08) [45] conv:(1.85)

2. income=43759_max 80 ==> age=52_max save_act=YES current_act=YES 61 conf:(0.76) < lift:(4.05)> lev:(0.08) [45] conv:(3.25)

3. income=43759_max current_act=YES 63 ==> age=52_max save_act=YES 61 conf:(0.97) < lift:(3.85)> lev:(0.08) [45] conv:(15.72)

4. age=52_max save_act=YES 151 ==> income=43759_max current_act=YES 61 conf:(0.4) < lift:(3.85)> lev:(0.08) [45] conv:(1.49)

5. age=52_max save_act=YES 151 ==> income=43759_max 76 conf:(0.5) < lift:(3.77)> lev:(0.09) [55] conv:(1.72)

對于挖掘出的每條規則，WEKA列出了它們關聯程度的四項指標。

命令行方式

我們也可以利用命令行來完成挖掘任務，在“Simlpe CLI”模塊中輸入如下格式的命令：

java weka.associations.Apriori options -t directory-path"bank-data-final.arff

即可完成Apriori算法。注意，“-t”參數后的文件路徑中不能含有空格。