2017-12-14 2 views
0

私はポリシー反復法を使ってガードワールドを解決する方法を知っています。どのようにして一般的な環境を解決することができますか?私のデータは、このようなものです:ポリシー反復を使用してJavaの一般的な環境エージェントを解決するにはどうすればよいですか?

partial data

これは私のデータの一部であり、それは遷移モデルを説明し、私はグリッドの世界を作成したくない、送信元と宛先のタイプがStringで言及してください。

私の状態を定義する方法と、それらを取得する方法がわかりません。ベクターを使ってそれらを保存することはできますか?それらを定義する方法が最初の問題です。

+0

青い言葉をクリックすると、私のデータ画像が表示されます。ありがとう。 –

答えて

0

状態を文字列のままにしておき、それぞれの一意の文字列は単一の状態を表します。浮動小数点型の文字列辞書として格納することができます。私はjavaでこれはMapと思う。

Map<string, double> states = new HashMap<string, double>(); 
+0

ありがとう、ニック。しかし、私はテキストファイルからそれらを読んで、私のJavaファイルにそれらを格納する必要があります。どうやってやるの?文字列は「ソース」と「宛先」を表し、ダブルタイプが確率を意味するため、 –

+0

あなたの質問は、テキストファイルを読む方法です? –

関連する問題