- 軟件大小:100.59M
- 軟件語言:中文
- 軟件類型:國產軟件
- 軟件類別:免費(fèi)軟件 / 數(shù)據庫類
- 更新時間:2017-05-24 08:26
- 運行環境:WinAll, WinXP, Win7, Win8
- 軟件等級:
- 軟件廠商:
- 官方網站:http://www.ynaad.com
![頂一個](/skins/gr/images/c_goodbg.png)
![踩一個](/skins/gr/images/c_badbg.png)
100.59M/中文/0.7
54.59M/中文/10.0
36.62M/中文/10.0
10000.00M/中(zhōng)文/0.8
1228.79M/中文/10.0
weka中文版(bǎn)官方最新版是(shì)一款(kuǎn)非常實用的數據挖掘軟件,這款軟件廣泛應用於SQL數據(jù)庫(kù)領用,下麵有綠色資源網小編為您帶來weka中文版32位/64位官網最新(xīn)版下載,需要的朋友歡迎來本站免費(fèi)下載使用。
WEKA的全名是懷卡托智能分析環境(Waikato Environment for Knowledge Analysis),同時weka也(yě)是新西蘭的一種鳥名,而(ér)WEKA的主要開發者來自新西蘭。
Weka是一款開源的、非商業性質(zhì)的免費數據挖掘軟件,集合了大量能承擔數(shù)據挖掘任務的計算機學(xué)習算法,包括對數據(jù)進(jìn)行預處理、分(fèn)類、回歸、聚類、關聯規則以及在(zài)新的交互界麵上的可視化。數據挖掘軟件Weka的技術基於假設數據(jù)是(shì)以一種單個文件或關聯的,在那裏,每個數(shù)據點(diǎn)都被許多屬性標注。
Weka使用Java的數據庫鏈接能力可以(yǐ)訪問SQL數據庫,並可以處理一個數據(jù)庫的查詢結果。它主要的用戶接品是Explorer,也同樣支持相同功能的命令行,或是(shì)一種基於組件的(de)知識流接(jiē)口。如果想自己實現數據挖掘算法的話,可以看一下Weka的接口文(wén)檔(dàng),在Weka 中集成自(zì)己(jǐ)的算法甚至借鑒它的(de)方法自己實現可視化工具(jù)並不是一件很困難的(de)事情。
WEKA把分(fèn)類(Classification)和回歸(Regression)都放在“Classify”選項卡中,這是有原因的。
在這兩個任務中,都有一個目標屬性(輸出變(biàn)量)。我們希望根據一個樣本(WEKA中稱作實例)的一組特征(zhēng)(輸入變量),對(duì)目標進行(háng)預測。為了實現 這一目的,我們需(xū)要有一個訓練數據集,這個數據集中每個實例的(de)輸入和輸出(chū)都是已知的。觀(guān)察訓練集中的實例,可以建立起預測的模型。有了這個模型,我(wǒ)們就可 以(yǐ)新的輸出未知的實例進行預(yù)測了。衡量模(mó)型的好壞就在於預測的(de)準確程度。
在WEKA中,待預測的目標(輸出)被稱作Class屬性,這(zhè)應該是來自分類任務的“類”。一般的,若Class屬(shǔ)性是分類型時我(wǒ)們的任務才(cái)叫(jiào)分類,Class屬性是數值型時我們的任務叫回歸。
現在我們計劃挖掘出支持度在10%到100%之間,並(bìng)且lift值超過1.5且lift值排在(zài)前(qián)100位的那些關聯規則(zé)。我們把 “lowerBoundMinSupport”和“upperBoundMinSupport”分別設為0.1和1,“metricType”設為(wéi) lift,“minMetric”設為1.5,“numRules”設為100。其他選項保持默認即可。“OK” 之後(hòu)在“Explorer”中點擊“Start”開始運行算法,在右邊窗口顯(xiǎn)示數據集(jí)摘要和挖掘結(jié)果。
下麵是挖掘出來的lift排前5的規則。
Best rules found:
1. age=52_max save_act=YES current_act=YES 113 ==> income=43759_max 61 conf:(0.54) < lift:(4.05)> lev:(0.08) [45] conv:(1.85)
2. income=43759_max 80 ==> age=52_max save_act=YES current_act=YES 61 conf:(0.76) < lift:(4.05)> lev:(0.08) [45] conv:(3.25)
3. income=43759_max current_act=YES 63 ==> age=52_max save_act=YES 61 conf:(0.97) < lift:(3.85)> lev:(0.08) [45] conv:(15.72)
4. age=52_max save_act=YES 151 ==> income=43759_max current_act=YES 61 conf:(0.4) < lift:(3.85)> lev:(0.08) [45] conv:(1.49)
5. age=52_max save_act=YES 151 ==> income=43759_max 76 conf:(0.5) < lift:(3.77)> lev:(0.09) [55] conv:(1.72)
對於挖掘出的每條規則,WEKA列出了它們關聯程度的四項指標。
命令行方式
我們也可以利(lì)用命(mìng)令行來(lái)完成挖掘任務,在“Simlpe CLI”模(mó)塊中輸入如下格式的命令:
java weka.associations.Apriori options -t directory-path"bank-data-final.arff
即可(kě)完成Apriori算法。注意,“-t”參數後的文件路徑中不能含有空格。
在(zài)前麵我們使用的(de)option為
-N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 命令行中使用這些參數得到的結果和前麵利用GUI得到的一(yī)樣。
我(wǒ)們還可以加上“- I”參數,得到不同項數的頻繁(fán)項集。我用的(de)命令如下:
java weka.associations.Apriori -N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -I -t d:"weka"bank-data-final.arff
挖掘結果在上(shàng)方顯示,應(yīng)是這個文件 的樣子。
請描(miáo)述您所遇到的錯誤(wù),我們將盡快予以修正,謝謝(xiè)!
*必填項,請輸入內容