Courceraのあるコースでの最終課題がKaggleのDetroit Blight Ticket Complianceだったため、挑戦。
一番最初に躓いたのが表記の件で、dispositionやviolation_codeを数値に変換しようとした際に、なぜか”Responsible (Fine Waived) by Deter”等の括弧を含むデータについて数値への変換ができておらず、RandomForestのfit関数がエラーになってしまう。
Debugで確認する限り、上記の文字列の認識自体はできているので、なかなか原因が分らず、、、。
こちらのリンクを参考にして解消。
括弧を含む文字列の場合は、\で囲う必要があるようです。