weka中文版下載32位-weka漢化版(數據挖（wā）掘)下載v3.8.0 官方最新版-綠色（sè）資源網

軟件介紹

weka中文版（bǎn）官方最新版是（shì）一款（kuǎn）非常實用的數據挖掘軟件，這款軟件廣泛應用於SQL數據（jù）庫（kù）領用，下麵有綠色資源網小編為您帶來weka中文版32位/64位官網最新（xīn）版下載，需要的朋友歡迎來本站免費（fèi）下載使用。

WEKA中文版官方（fāng）介紹

WEKA的全名是懷卡托智能分析環境（Waikato Environment for Knowledge Analysis），同時weka也（yě）是新西蘭的一種鳥名，而（ér）WEKA的主要開發者來自新西蘭。

Weka是一款開源的、非商業性質（zhì）的免費數據挖掘軟件，集合了大量能承擔數（shù）據挖掘任務的計算機學（xué）習算法，包括對數據（jù）進（jìn）行預處理、分（fèn）類、回歸、聚類、關聯規則以及在（zài）新的交互界麵上的可視化。數據挖掘軟件Weka的技術基於假設數據（jù）是（shì）以一種單個文件或關聯的，在那裏，每個數（shù）據點（diǎn）都被許多屬性標注。

Weka使用Java的數據庫鏈接能力可以（yǐ）訪問SQL數據庫，並可以處理一個數據（jù）庫的查詢結果。它主要的用戶接品是Explorer，也同樣支持相同功能的命令行，或是（shì）一種基於組件的（de）知識流接（jiē）口。如果想自己實現數據挖掘算法的話，可以看一下Weka的接口文（wén）檔（dàng），在Weka 中集成自（zì）己（jǐ）的算法甚至借鑒它的（de）方法自己實現可視化工具（jù）並不是一件很困難的（de）事情。

weka中文版（bǎn）官（guān）方最新版

WEKA背景知識

WEKA把分（fèn）類(Classification)和回歸(Regression)都放在“Classify”選項卡中，這是有原因的。

在這兩個任務中，都有一個目標屬性（輸出變（biàn）量）。我們希望根據一個樣本(WEKA中稱作實例)的一組特征（zhēng）（輸入變量），對（duì）目標進行（háng）預測。為了實現這一目的，我們需（xū）要有一個訓練數據集，這個數據集中每個實例的（de）輸入和輸出（chū）都是已知的。觀（guān）察訓練集中的實例，可以建立起預測的模型。有了這個模型，我（wǒ）們就可以（yǐ）新的輸出未知的實例進行預（yù）測了。衡量模（mó）型的好壞就在於預測的（de）準確程度。

在WEKA中，待預測的目標（輸出）被稱作Class屬性，這（zhè）應該是來自分類任務的“類”。一般的，若Class屬（shǔ）性是分類型時我（wǒ）們的任務才（cái）叫（jiào）分類，Class屬性是數值型時我們的任務叫回歸。

WEKA漢化版參數設置

現在我們計劃挖掘出支持度在10%到100%之間，並（bìng）且lift值超過1.5且lift值排在（zài）前（qián）100位的那些關聯規則（zé）。我們把 “lowerBoundMinSupport”和“upperBoundMinSupport”分別設為0.1和1，“metricType”設為（wéi） lift，“minMetric”設為1.5，“numRules”設為100。其他選項保持默認即可。“OK” 之後（hòu）在“Explorer”中點擊“Start”開始運行算法，在右邊窗口顯（xiǎn）示數據集（jí）摘要和挖掘結（jié）果。

下麵是挖掘出來的lift排前5的規則。

Best rules found:

1. age=52_max save_act=YES current_act=YES 113 ==> income=43759_max 61 conf:(0.54) < lift:(4.05)> lev:(0.08) [45] conv:(1.85)

2. income=43759_max 80 ==> age=52_max save_act=YES current_act=YES 61 conf:(0.76) < lift:(4.05)> lev:(0.08) [45] conv:(3.25)

3. income=43759_max current_act=YES 63 ==> age=52_max save_act=YES 61 conf:(0.97) < lift:(3.85)> lev:(0.08) [45] conv:(15.72)

4. age=52_max save_act=YES 151 ==> income=43759_max current_act=YES 61 conf:(0.4) < lift:(3.85)> lev:(0.08) [45] conv:(1.49)

5. age=52_max save_act=YES 151 ==> income=43759_max 76 conf:(0.5) < lift:(3.77)> lev:(0.09) [55] conv:(1.72)

對於挖掘出的每條規則，WEKA列出了它們關聯程度的四項指標。

命令行方式

我們也可以利（lì）用命（mìng）令行來（lái）完成挖掘任務，在“Simlpe CLI”模（mó）塊中輸入如下格式的命令：

java weka.associations.Apriori options -t directory-path"bank-data-final.arff

即可（kě）完成Apriori算法。注意，“-t”參數後的文件路徑中不能含有空格。