RのWeb制作

Webサービス制作のための技術情報を。

Python データサイエンス

[python]決定木(CHAID)のテストと可視化(未完成)

投稿日:

意思決定のために使用される決定木分析

scikit-learnにはCART(giniまたはentropy)が採用されています。
これは2分岐しかせず、実務では単純すぎる、過学習させる等の理由から使われていません。

実務ではCHAID(カイ二乗値)が使われています。
利点としては、以下の2点が大きいです。
・多分岐
・過学習する前に学習を止める

ただ一般的なライブラリがないので、今回はライブラリのCHAIDを紹介します。

SPSS等との差分は未検証です。
検証が終了次第、追記させていただきます。

-Python, データサイエンス

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

「実践!Chainerとロボットで学ぶディープラーニング」を作ってみた

実践!Chainerとロボットで学ぶディープラーニングを購入しました。 単純にロボを動かすのは楽しいです。 周りに意外と買った人が居ないようなので、レビューを書きました。 所感 ちょっとお高いけど、土 …

Python可読性高すぎてすごい

コード ちょっと詰めて書いていますが year = int(input("あなたの生まれ年を西暦4桁年で表記してください:")) eto_list = (‘子’, ‘丑’, ‘寅’ …

TensorFlow RNNで詰まるの巻

DeeplearningのフレームワークTensorFlowの学習まで漕ぎ着けました。 CNN(画像認識用と言っても過言ではない)はゼロから始めるディープラーニングでだいたいOK。 何度か読み返してわ …

[Anaconda]Anacondaが動かない!TypeError: expected str, bytes or os.PathLike object, not NoneType

Anaconda Navigatorが起動できません。 昨日まで動いていたのに・・・。 エラー文はこちら TypeError: expected str, bytes or os.PathLike o …

手書き数字診断士(機械学習)ver 0.0

手書き数字診断士、まずは動くようにしました。 ただ、初っ端から間違えています・・・! 動画 http://webmaking.rei-farms.jp/wp-content/uploads/2018/ …