weka中文版下載32位(wèi) 最新軟件|熱門排行|軟件分類|軟件專(zhuān)題|廠(chǎng)商大全

您的位置: 首(shǒu)頁編程開發數據庫類 → weka漢(hàn)化版(數據(jù)挖掘) v3.8.0 官方最新版

weka漢化版(數據挖掘)

v3.8.0 官方最新版 weka漢化(huà)版(數據挖掘) 網友評分:8

同類相關軟件

軟件介紹

軟件標簽: weka 數據挖掘

weka中文版(bǎn)官方最新版是(shì)一款(kuǎn)非常實用的數據挖掘軟件,這款軟件廣泛應用於SQL數據(jù)庫(kù)領用,下麵有綠色資源網小編為您帶來weka中文版32位/64位官網最新(xīn)版下載,需要的朋友歡迎來本站免費(fèi)下載使用。

WEKA中文版官方(fāng)介紹

WEKA的全名是懷卡托智能分析環境(Waikato Environment for Knowledge Analysis),同時weka也(yě)是新西蘭的一種鳥名,而(ér)WEKA的主要開發者來自新西蘭。

Weka是一款開源的、非商業性質(zhì)的免費數據挖掘軟件,集合了大量能承擔數(shù)據挖掘任務的計算機學(xué)習算法,包括對數據(jù)進(jìn)行預處理、分(fèn)類、回歸、聚類、關聯規則以及在(zài)新的交互界麵上的可視化。數據挖掘軟件Weka的技術基於假設數據(jù)是(shì)以一種單個文件或關聯的,在那裏,每個數(shù)據點(diǎn)都被許多屬性標注。

Weka使用Java的數據庫鏈接能力可以(yǐ)訪問SQL數據庫,並可以處理一個數據(jù)庫的查詢結果。它主要的用戶接品是Explorer,也同樣支持相同功能的命令行,或是(shì)一種基於組件的(de)知識流接(jiē)口。如果想自己實現數據挖掘算法的話,可以看一下Weka的接口文(wén)檔(dàng),在Weka 中集成自(zì)己(jǐ)的算法甚至借鑒它的(de)方法自己實現可視化工具(jù)並不是一件很困難的(de)事情。

weka中文版(bǎn)官(guān)方最新版

WEKA背景知識

WEKA把分(fèn)類(Classification)和回歸(Regression)都放在“Classify”選項卡中,這是有原因的。

在這兩個任務中,都有一個目標屬性(輸出變(biàn)量)。我們希望根據一個樣本(WEKA中稱作實例)的一組特征(zhēng)(輸入變量),對(duì)目標進行(háng)預測。為了實現 這一目的,我們需(xū)要有一個訓練數據集,這個數據集中每個實例的(de)輸入和輸出(chū)都是已知的。觀(guān)察訓練集中的實例,可以建立起預測的模型。有了這個模型,我(wǒ)們就可 以(yǐ)新的輸出未知的實例進行預(yù)測了。衡量模(mó)型的好壞就在於預測的(de)準確程度。

在WEKA中,待預測的目標(輸出)被稱作Class屬性,這(zhè)應該是來自分類任務的“類”。一般的,若Class屬(shǔ)性是分類型時我(wǒ)們的任務才(cái)叫(jiào)分類,Class屬性是數值型時我們的任務叫回歸。

WEKA漢化版參數設置

現在我們計劃挖掘出支持度在10%到100%之間,並(bìng)且lift值超過1.5且lift值排在(zài)前(qián)100位的那些關聯規則(zé)。我們把 “lowerBoundMinSupport”和“upperBoundMinSupport”分別設為0.1和1,“metricType”設為(wéi) lift,“minMetric”設為1.5,“numRules”設為100。其他選項保持默認即可。“OK” 之後(hòu)在“Explorer”中點擊“Start”開始運行算法,在右邊窗口顯(xiǎn)示數據集(jí)摘要和挖掘結(jié)果。

下麵是挖掘出來的lift排前5的規則。

Best rules found:

1. age=52_max save_act=YES current_act=YES 113 ==> income=43759_max 61 conf:(0.54) < lift:(4.05)> lev:(0.08) [45] conv:(1.85)

2. income=43759_max 80 ==> age=52_max save_act=YES current_act=YES 61 conf:(0.76) < lift:(4.05)> lev:(0.08) [45] conv:(3.25)

3. income=43759_max current_act=YES 63 ==> age=52_max save_act=YES 61 conf:(0.97) < lift:(3.85)> lev:(0.08) [45] conv:(15.72)

4. age=52_max save_act=YES 151 ==> income=43759_max current_act=YES 61 conf:(0.4) < lift:(3.85)> lev:(0.08) [45] conv:(1.49)

5. age=52_max save_act=YES 151 ==> income=43759_max 76 conf:(0.5) < lift:(3.77)> lev:(0.09) [55] conv:(1.72)

對於挖掘出的每條規則,WEKA列出了它們關聯程度的四項指標。

命令行方式

我們也可以利(lì)用命(mìng)令行來(lái)完成挖掘任務,在“Simlpe CLI”模(mó)塊中輸入如下格式的命令:

java weka.associations.Apriori options -t directory-path"bank-data-final.arff

即可(kě)完成Apriori算法。注意,“-t”參數後的文件路徑中不能含有空格。

在(zài)前麵我們使用的(de)option為

-N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 命令行中使用這些參數得到的結果和前麵利用GUI得到的一(yī)樣。

我(wǒ)們還可以加上“- I”參數,得到不同項數的頻繁(fán)項集。我用的(de)命令如下:

java weka.associations.Apriori -N 100 -T 1 -C 1.5 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -I -t d:"weka"bank-data-final.arff

挖掘結果在上(shàng)方顯示,應(yīng)是這個文件 的樣子。

軟件截圖(tú)

下載地址 電腦版

用戶評論

熱門評論

最新評論

發表評論 查看所有評論(0)

昵稱:
請不(bú)要評論無意義或髒話,我們所有評論會有人工審核.
字數: 0/500 (您的評論需要經過審核才能顯示)
免费人欧美成又黄又爽的视频丨一本色道久久88综合日韩精品丨国产专区日韩精品欧美色丨午夜无遮挡男女啪啪视频丨国产欧美日韩综合精品一区二区丨亚洲精品无码不卡在线播HE丨亚洲精品国产精品国自产观看丨日韩国产高清av不卡