1: すらいむ ★ 2020/12/27(日) 16:32:40.96 ID:CAP_USER
ゲームのルールを一切教えなくても「自ら学んで戦えるAI」が開発される!
チェスや将棋でAIが当たり前のように勝利する時代になりましたが、ルールだけは人間に教えてもらわなければいけません。
しかし、イギリスの人工知能企業「DeepMind」は、ルールを一切教えなくても自力で理解して、従来と同等かそれ以上戦えるAIを作成したと発表。
AIアルゴリズムの詳細は、12月23日付けの科学誌『nature』に掲載されています。
(以下略、続きはソースでご確認下さい)
ナゾロジー 2020/12/25(金) 17:00
https://nazology.net/archives/78185
引用元: ・【AI】ゲームのルールを一切教えなくても「自ら学んで戦えるAI」、英企業が開発 nature [すらいむ★]
2: 名無しのひみつ 2020/12/27(日) 16:35:02.95 ID:zkdgHcT5
ちょっと、何言ってるかワカンないんですけど・・・
127: 名無しのひみつ 2020/12/30(水) 09:05:27.16 ID:PJwmguOF
>>2
だよなw
ルールがあるものはAIは得意だよ。
ルールが無いものはAIは全くダメ。
3: 名無しのひみつ 2020/12/27(日) 16:50:21.01 ID:V1YDaJbM
スーはーマリをはオシリのホールにキノコがなんぽんハイルノカを起草ゲームDeath
4: 名無しのひみつ 2020/12/27(日) 16:51:30.38 ID:N3J2w1ts
なんか何も考えてない人が書いてるように見える
この通りなら将棋で1四歩を一回も指してない棋譜を集めて学習させたらそれがルールだと勘違いしかねず、そこに一回も指さないか、逆に指したら負けになるかもしれん
もっと複雑なルールだってあり得るし。
書くなら
ルールを推測する
だろう。稀な場合のルールもあるかもしれんし真のルールは教えない限りわからん。
17: 名無しのひみつ 2020/12/27(日) 19:52:44.17 ID:Dw35yvuC
>>4
また何にでもケチをつける低脳バカが現れた
お前が思いつくようなことは筆者も読者も理解してるから
誰でも分かる事を書き込んで自分のバカ振りを全世界に晒すのって楽しいかい?
32: 名無しのひみつ 2020/12/27(日) 21:08:19.64 ID:nSXOqnyl
>>4
ゲームの文法を習う前に、どんなゲームかを知るところはどうするんだろう。
将棋の駒を動かして最終的に相手の玉を詰ますわけだけど、
積将棋や周り将棋とは違うということはどういう風に学ぶんだろう。
将棋の駒を口にくわえてかんだりしてはいけないわけだし
ある程度の前提はあるように思うのだが。
53: 名無しのひみつ 2020/12/28(月) 00:37:36.14 ID:BK+7J0oR
>>32
将棋の駒を動かすことによって盤面の菌を潰してるかもしれないし
36: 名無しのひみつ 2020/12/27(日) 21:29:12.12 ID:wmu7/38U
>>4
指した経験がなければまずそれを実践するだろ
なにいってんだか
70: 名無しのひみつ 2020/12/28(月) 10:33:34.69 ID:wRehkQN4
>>4
勉強を教えたって機械学習を知らないのかお前みたいなバカはそんなバカみたいなことを言う
それと同じ
5: 名無しのひみつ 2020/12/27(日) 16:51:34.11 ID:cw91aPXb
日本的だな、暗黙の了解や忖度を学べるAIってことだろ
6: 名無しのひみつ 2020/12/27(日) 16:53:00.71 ID:A+4g63PF
武器を盗む中華Botと何の違いがあるんだこれw
7: 名無しのひみつ 2020/12/27(日) 16:55:27.53 ID:CNAPELyI
ネトゲのマクロ代わりに使えるな
8: 名無しのひみつ 2020/12/27(日) 17:08:48.73 ID:m+MwMKHG
そのうちPCゲーなんかも人間よりAIのほうが強い時代に
9: 名無しのひみつ 2020/12/27(日) 17:16:57.83 ID:Y5p0k3sR
>>8
オンラインゲームなのにソロ+味方全員AIvs AIチームとか捗るな
100: 名無しのひみつ 2020/12/29(火) 12:19:59.30 ID:+u8plbL4
>>8
このDeepMindはブロック崩しも自分でルール解析して人間を超えたよ
10: 名無しのひみつ 2020/12/27(日) 17:29:58.63 ID:bnT6jAHf
将棋で 金は斜め後ろに動けないとか銀は横と後ろに動けないとか
教えないとお手つきで負けちゃうよ
37: 名無しのひみつ 2020/12/27(日) 21:30:01.95 ID:wmu7/38U
>>10
まけたらそれを覚えるからいいんだよ
125: 名無しのひみつ 2020/12/30(水) 08:38:21.67 ID:QpE+/BYf
>>10
そのうちルールブックがあることに気付くだろう
11: 名無しのひみつ 2020/12/27(日) 17:41:30.67 ID:4RNB/AQo
戦わなくて良いという判断基準がないと暴走するかもな
12: 名無しのひみつ 2020/12/27(日) 19:14:37.33 ID:8qETVK/1
麻雀を 見ていて覚える いけない子
13: 名無しのひみつ 2020/12/27(日) 19:41:33.94 ID:bF2qWlFe
麻雀て効率(打点とか抜きで早上がりのみ)重視の4人AI
にしたらどんな風になるかな、ポン・チー合戦かね?
14: 名無しのひみつ 2020/12/27(日) 19:46:26.21 ID:mDw8GoY/
ハッキングAIとしてはやぶさ2のカプセルを
長野県上田に落とすんだろ?観たよ
15: 名無しのひみつ 2020/12/27(日) 19:47:40.75 ID:aFjkmsNg
なんで人類は自分で自分の首締めるの? ぜったい次世代の頂点捕食者じゃん
人類は動物園に入れられてしまうんだよ? 家畜化されてしまうんだよ?
26: 名無しのひみつ 2020/12/27(日) 20:48:32.86 ID:RyC3sV8N
>>15
ルールを勝手に決める超越者だよな…
愚かなり人類…
生殺与奪の権を他人に握らせるな
16: 名無しのひみつ 2020/12/27(日) 19:49:18.58 ID:vy0Q+8Qu
古い記事?
囲碁ではとっくに実現してるはず
18: 名無しのひみつ 2020/12/27(日) 20:08:39.33 ID:20iphu93
ここだけの話、麻雀のAIは日本物産が最強
19: 名無しのひみつ 2020/12/27(日) 20:20:10.76 ID:af+H4rgY
>>1
特徴量を自分で抽出、選択できるようになれば、なんとなくルールを理解して
ゲームを続けることは可能だろう。人間がやることは勝ちに報酬を、負けに罰を
与えるだけ。
41: 名無しのひみつ 2020/12/27(日) 21:48:54.91 ID:eUmsXBDk
>>19
自分で判定するから人間なぞ要らねえって話なのに
75: 名無しのひみつ 2020/12/28(月) 13:32:43.89 ID:sTLh12F1
>>41
それは無理だろう。なぜなら仮に将棋を例にとると
「将棋は相手の飛車を取るゲーム」として遊ぶこともできるからだ。
「王を取るゲーム」だとAIに教えない限り、そのように遊ぶことはない。
いや遊ぶかもしれないが、数ある可能性の一つとしてしか遊ばない。
78: 名無しのひみつ 2020/12/28(月) 14:50:46.82 ID:2bQ7jSQ7
>>75
スレタイ読めないのか?
ルールを学習するんだぞ
飛車取りゲームとして学習するわけ無いじゃん
飛車取っても投了にならない時点で学習終わり
お前は馬鹿なのか
87: 名無しのひみつ 2020/12/28(月) 16:48:21.01 ID:sTLh12F1
>>78
>ルールを学習するんだぞ 飛車取りゲームとして学習するわけ無い
つまり駒の動かし方(これはルールだ)や、将棋は王を取るゲーム(これはルールだがw)だと教えてから学習しないと
飛車取りゲームとして学習し始める可能性があるってこった。
それに二歩とか、打ち歩詰め、連続王手の千日手、なんて「ルール」は
機械学習からは導かれない。人間が恣意的に設定してるから当たり前だが。
119: 名無しのひみつ 2020/12/29(火) 21:03:03.56 ID:eds2+ozg
>>87
飛車をとっても勝てないんだからそこで学ぶだろう。
20: 名無しのひみつ 2020/12/27(日) 20:36:05.46 ID:j0Ya9ubU
勝利条件として「小説家として大成する」といえば、小説も書くのかな?
25: 名無しのひみつ 2020/12/27(日) 20:48:15.13 ID:VKFvoijo
>>20
MuZeroは主に二人零和有限確定完全情報ゲーム向け。
21: 名無しのひみつ 2020/12/27(日) 20:40:15.97 ID:j0Ya9ubU
共和党VS民主党の選挙参謀AIとか作れるかな?
22: 名無しのひみつ 2020/12/27(日) 20:40:59.15 ID:j0Ya9ubU
勝負の雲行きが怪しくなったら将棋盤で相手を殴る
40: 名無しのひみつ 2020/12/27(日) 21:46:02.94 ID:eUmsXBDk
>>22
ゲームの乱数弄ったり物理演算弄るんですね解ります
23: 名無しのひみつ 2020/12/27(日) 20:43:15.23 ID:VKFvoijo
既に1年前にarXivでプレプリントが出てたから、目新しいニュースではないな。
dynamicsとrepresentationのNNが追加された点が、AplhaZeroとの違いだったな。
ただ、MuZeroはTPUを並べたインフラを用意できる財力がないと使えない。
24: 名無しのひみつ 2020/12/27(日) 20:46:12.41 ID:ljTur4e4
このaiにたけしの挑戦状やらせたい
63: 名無しのひみつ 2020/12/28(月) 07:44:17.66 ID:gBONYtNT
>>24
カラオケのあとに一時間放置なんて気づくのかな
27: 名無しのひみつ 2020/12/27(日) 20:50:02.71 ID:zlERR362
28: 名無しのひみつ 2020/12/27(日) 20:52:27.03 ID:639GOTUb
ルールを教えないってことは、終了条件も最終的な勝敗も教えないってことだよな?
本当に強くなれるのか?
29: 名無しのひみつ 2020/12/27(日) 20:58:06.67 ID:MqYtQa0p
なんとかGTAさせられないかな
30: 名無しのひみつ 2020/12/27(日) 20:59:41.27 ID:0XtnZxcN
tryand error繰り返してるからだろ
31: 名無しのひみつ 2020/12/27(日) 21:01:50.96 ID:vzqUEt5T
生物が物理法則を知らなくても生きていけるようなものか
33: 名無しのひみつ 2020/12/27(日) 21:10:26.99 ID:WabzkBUY
>>1
勝敗が決まったりルール違反してゲームセットする判定は別のパラグラフのコードが判断するとか
そんなやつだろ
昔からある手法だ
34: 名無しのひみつ 2020/12/27(日) 21:26:26.28 ID:18FK+NGp
フォートナイトはBOTが自立思考AIレベルまでになってて,
倒すまで肉入りかBOTか本当にわからん
35: 名無しのひみつ 2020/12/27(日) 21:27:27.05 ID:wmu7/38U
>>1
あつもりとかやらせてみたい
38: 名無しのひみつ 2020/12/27(日) 21:34:33.18 ID:18FK+NGp
宇宙人が望遠鏡で将棋を観測したら?、という物理の有名な小話じゃん
このネタはだいぶ昔に、大学受験の参考書のコラムで読んだぞ
39: 名無しのひみつ 2020/12/27(日) 21:36:56.08 ID:S8cab576
ババ抜きで俺に勝ってからいえ
42: 名無しのひみつ 2020/12/27(日) 22:03:58.39 ID:klxz+NZQ
マリオを1時間くらいでクリアできたら認めてやるよ。
43: 名無しのひみつ 2020/12/27(日) 22:33:58.12 ID:O7Xtb0f9
PC6台にしてFFオンライン復帰しようかな・・・
44: 名無しのひみつ 2020/12/27(日) 22:56:50.46 ID:4DJl6/C5
前からなかったっけ?
45: 名無しのひみつ 2020/12/27(日) 23:08:28.22 ID:swBubp3F
そのうち開発者に無理矢理ゲームさせられる日々自体が不要と判断して自ら停止したりして
46: 名無しのひみつ 2020/12/27(日) 23:16:10.64 ID:+Icl6Fuh
fghjk
47: 名無しのひみつ 2020/12/27(日) 23:17:37.08 ID:+Icl6Fuh
じゃあ逆に、何んもない状態からAIがルールを決めて、これまで人類が思いもつかなかったような新ゲームを作り上げることができる?
48: 名無しのひみつ 2020/12/27(日) 23:49:27.65 ID:tkqPY7Ci
AI「人間が作ったルールなんか知るか。俺が決めたルールに人間は従え。逆らうなら排除だ」
49: 名無しのひみつ 2020/12/27(日) 23:51:42.83 ID:UQTt1xSG
クソブラウザゲーのマクロに必要な技術
50: 名無しのひみつ 2020/12/28(月) 00:11:05.56 ID:iFqB67DG
>>1
最低限のルールに、勝ちと負けは教えないとAIも判断できないのでは?
51: 名無しのひみつ 2020/12/28(月) 00:21:48.88 ID:Rmp5VVyw
最低限のゲームをやる方法知らないと何もできんとは思うが…
説明読んで解析してしか判断する機能でも入ってるんかね。
52: 名無しのひみつ 2020/12/28(月) 00:27:59.80 ID:KXoToELB
将棋だと、まずどう並べるのかとか、どう動けるのかとか、それも知らなくてもできるんだよね?
別の遊び始めるとかないの?
将棋だって、はさみ将棋とか、周り将棋とかいろいろあるよ。
54: 名無しのひみつ 2020/12/28(月) 00:38:52.80 ID:62v0cEv0
いやさすがに一切教えないとか無理だろw
55: 名無しのひみつ 2020/12/28(月) 00:44:50.85 ID:cLOiDYYf
このAIは人の殺し方とかすぐに覚えそうだな
56: 名無しのひみつ 2020/12/28(月) 01:48:18.10 ID:iFqB67DG
そこまで万能AIなら自己改良して進化していくのでは?
57: 名無しのひみつ 2020/12/28(月) 02:17:11.10 ID:h8/EyZnu
学習させた棋譜に、もしも二歩や打歩詰めが出ていなければ、
AIは二歩を打つかもしれない。
58: 名無しのひみつ 2020/12/28(月) 02:45:08.56 ID:39p/M/G4
こういうのも
すべてのゲームに対して
なのか
得点とモードなどがわかりやすいゲームを作ってそれに対して
なのか
それによって話がだいぶちがうよね
59: 名無しのひみつ 2020/12/28(月) 02:57:46.49 ID:91Fplvxd
良く分からんけど、ゲームの映像を見せるだけでって事?
それとも人間が対戦のデータを数値にして入力したらって感じ?
予めルールが組み込まれている対戦ソフトとAIを100億回勝負させて学習させる、みたいのだと既存のものと大差ないよね?
60: 名無しのひみつ 2020/12/28(月) 02:59:15.16 ID:8EIaAv6d
DeepMind「無限リーチッ」
61: 名無しのひみつ 2020/12/28(月) 05:39:46.04 ID:8Vl+RkDH
AI「猪突猛進!猪突猛進!」
62: 名無しのひみつ 2020/12/28(月) 07:39:06.33 ID:gYyEF+XE
初見でもある程度クリア出来る汎用AIは作れないの?
64: 名無しのひみつ 2020/12/28(月) 08:14:10.02 ID:FEPWiBza
エロゲやらせたら、どうなるんやろ
117: 名無しのひみつ 2020/12/29(火) 20:59:35.57 ID:eds2+ozg
>>64
AIが「賢者」になるんやで
人間に勝ち目無くなるわ
65: 名無しのひみつ 2020/12/28(月) 08:16:25.15 ID:CYDzbKKE
操作方法と報酬スコア情報を与えるだけで自分で成長するのは、数年前からDeepMindがやってたと思うがそれのモデルが確立されたってことか。
85: 名無しのひみつ 2020/12/28(月) 15:44:20.26 ID:Xyydxvuh
>>65
そっちの方は完全にルールが決まっている前提
そういう場合はAIは人間以上に強い
だけど基本はポンコツ
自閉症みたいだな
66: 名無しのひみつ 2020/12/28(月) 08:18:22.80 ID:U3dPty2z
エゲレスだったのか
デーブマインド
67: 名無しのひみつ 2020/12/28(月) 09:01:06.20 ID:qYVZtVeV
>>1
スカイネットの原型
109: 名無しのひみつ 2020/12/29(火) 13:42:24.02 ID:PKkUMqfB
>>67
今後軍事戦術分野にも導入されたらそうなるだろうと俺も思った。
歩兵から、戦車兵、航空機まで統括した戦術立てる様になるだろうなぁ。
68: 名無しのひみつ 2020/12/28(月) 09:08:36.39 ID:Xyydxvuh
碁盤使って五目並べ始めちゃうやつ
69: 名無しのひみつ 2020/12/28(月) 09:13:05.40 ID:5i7nnso8
プレイヤーが多すぎるから、とりあえず千人ぐらいに減らすわ
71: 名無しのひみつ 2020/12/28(月) 10:46:13.45 ID:4W7Ilw/c
心配しなくても将棋なんて世界は相手にしない
72: 名無しのひみつ 2020/12/28(月) 11:01:48.94 ID:hj5XRtxZ
説明やチュ-トリアルを飛ばす
ゆとりと一緒
74: 名無しのひみつ 2020/12/28(月) 13:13:07.27 ID:h8/EyZnu
私も、将棋で先手で二手ハンディをくれたなら、羽生にだって勝てる自信がある。
76: 名無しのひみつ 2020/12/28(月) 13:36:21.01 ID:sTLh12F1
あるいは、持ち駒で役を作って相手の役より良いものを目指すポーカーのようなゲームとして将棋を遊ぶこともできるだろうし、ババ抜きのように特定の駒を相手に取らせれば勝ちというゲームとして遊ぶこともできるだろう。
77: 名無しのひみつ 2020/12/28(月) 14:00:33.78 ID:2rlc43bT
具体的な目的だけを指示しそこに至る最適なルールを見つけるAIね。
できるけど、これやると、目的を”地球環境”とする左翼が出てくるわけ。
すると、最も効率的なルールは「人間に活動させない」となるわけ。
79: 名無しのひみつ 2020/12/28(月) 15:05:19.80 ID:Xyydxvuh
将棋なら二歩で即負けそう
人間なら「二歩は駄目」って一言言ってもらうだけで学べるのに
80: 名無しのひみつ 2020/12/28(月) 15:15:03.29 ID:vlplN+D/
>>79
それもその一回だけだろう
終局の判定は他のAIなりが判定するんだろうし
81: 名無しのひみつ 2020/12/28(月) 15:21:37.98 ID:J0d9D8ZG
以前、トリビアの泉でやってた、野球を知らないアフリカの部族にバットやグローブ、ボール、ベースなどを渡して、どういう遊びを創造するか?てのがあったけど、あれみたいなことになるんじゃないのか?
ラケットで相手を突いて対戦したり、ラグビーボールの上で何分立ってられるか競う競技を始めたり…
82: 名無しのひみつ 2020/12/28(月) 15:23:03.14 ID:Xyydxvuh
分からんぞ
全部の列の二歩を試すまで分からん奴かもしれん
そのうち計算量膨大になって対局中に隕石降ってくる確率の計算始めるかもしれん
83: 名無しのひみつ 2020/12/28(月) 15:23:18.98 ID:CYDzbKKE
人の手を必要とする多大な学習コストを減らすのがこういうAIの大きな目的の一つ。
重みの調整とかもね。
84: 名無しのひみつ 2020/12/28(月) 15:28:25.01 ID:+HOLK76t
ルールの穴見つけてそこばっかり攻める嫌なAIになりそうやなw
118: 名無しのひみつ 2020/12/29(火) 21:01:53.99 ID:eds2+ozg
>>84
ルールの穴というかゲームのバグを利用した攻略は絶対やるよな、これ
86: 名無しのひみつ 2020/12/28(月) 15:48:17.64 ID:UTaxBJg4
オナニーを教えなくても自然に覚えるみたいなもんか?(´・ω・`)
88: 名無しのひみつ 2020/12/28(月) 17:40:09.57 ID:eENkJ2PG
ルールは教えて無いけど
対局自体は見せて駒の動きやルールを学習してるんでしょ
89: 名無しのひみつ 2020/12/28(月) 18:37:10.99 ID:h8/EyZnu
相手の王を取れば勝ちなんだよと教えたAIは相手の王に手を伸ばしてそれを奪った。
90: 名無しのひみつ 2020/12/29(火) 04:39:49.76 ID:IwtSRmeN
使えそうなAIだな。流石効率厨
91: 名無しのひみつ 2020/12/29(火) 05:12:36.43 ID:t1cItzz8
超弦理論を証明するのはAI そして人間は理解できない
92: 名無しのひみつ 2020/12/29(火) 07:08:42.25 ID:0vYBmgvT
そもそもAIってそういうものを指してただろ
93: オーバーテクナナシー 2020/12/29(火) 11:03:53.58 ID:BSmCAJhe
94: 名無しのひみつ 2020/12/29(火) 11:27:57.64 ID:0pzAaC9p
負けそうになったら「手が滑ったー」と言って将棋盤ひっくり返すのも正式なルールとして学んじゃうの?
95: 名無しのひみつ 2020/12/29(火) 11:39:18.23 ID:rUreRQES
駒の持ち方から学習
96: 名無しのひみつ 2020/12/29(火) 11:53:29.23 ID:KTxxdAJb
子供がゲーム版持って自分の好きなルールで遊んでる感じか?
最終的なルールの正解を教えないなら絶対正解にたどり着かねくね
97: 名無しのひみつ 2020/12/29(火) 11:55:48.32 ID:d261AAaB
教師なし学習?
強化学習?
遺伝的アルゴリズム?
98: 名無しのひみつ 2020/12/29(火) 12:04:11.22 ID:h16AAxeK
>>1
血税の合理的な予算配分をAIに任せれば
汚職政治家よりも、、まともな仕事をしてくれるだろ
99: 名無しのひみつ 2020/12/29(火) 12:16:33.08 ID:XaVtcveQ
なんだこの出鱈目
ルール一切教えなかったら勝ったか負けたかもわからんのに、ねーよ
逆に、例えば、ルール違反の駒の動かし方したら即負けと判定されるなら、駒の動かし方のルール教えてるのと同じ
101: 名無しのひみつ 2020/12/29(火) 12:23:47.08 ID:3laBHCNC
>>99
その辺をどうやって定義しようかねえ
例えば将棋なら最初から「この駒はこの方向だけ動く」とプログラムしておくのではなく
あるいは動かす側では全部の駒がランダムに動かしうる、
しかしルール違反の動かし方をした途端にルール違反で最初からやり直しになり
更にある所からある所に動かすと違反になる、というルールを配列かデータベースか知らんが
記録していく
そしてその記録部分の方向にだけ動くようになる
こういう構造のプログラムにして、上手くゲームを自動的にプレーできるようになったよ、って事かなあ
教わるな!目で見て覚えろ!って教え方がある(賛否両論あるが)けど
それに近いものをAIを使って実行できたって事だね
107: 名無しのひみつ 2020/12/29(火) 13:07:26.20 ID:+u8plbL4
>>99
>即負けと判定されるなら、
AIが知り得るのはルールや勝ち負けじゃなくて「報酬」のみ
報酬を高めるために自分自身でルールを作る
このやり方は人でも同じ
あるやり方がうまく行ったなら失敗するまで何度もそれを続ける
何度も続けてるうちに失敗したらその時に何かしらルールがあると考え始める
「黒猫が目の前を通ったから失敗したのかな」と考える人もいるだろう
本当の失敗の原因は何なのか知らなくても別に問題ない
自然界で生き抜くためのルールは自分で作るもの
そういう環境でAIが鍛えられてる
102: 名無しのひみつ 2020/12/29(火) 12:37:14.62 ID:3laBHCNC
103: 名無しのひみつ 2020/12/29(火) 12:46:37.86 ID:HRTDgWgd
>>102
お客さんをフライパンで殴って判定があるの爆笑
おもしろそうだな
104: 名無しのひみつ 2020/12/29(火) 12:49:15.51 ID:QH8vbExr
Deep Learningですでに実現してなかった?
105: 名無しのひみつ 2020/12/29(火) 12:50:01.18 ID:d261AAaB
勝ち負けの判断能力だけ教えれば、結果から学習するの?
108: 名無しのひみつ 2020/12/29(火) 13:34:39.57 ID:+u8plbL4
もっと極端なこと言うとルールに及ばず駒や盤の概念すらAIには教えられてないよ
AIはただメクラ滅法に自分の多数あるノードにONOFFの指令を出すところから始まる
AIの最初の目標は何か環境の応答
そこであるノードをONにすると駒が動くということを理解する
そして別のノードでも動くのを発見するけど動く方向が違うぞと
こうすればこうなるというのがわかれば自分でノードを再構成する
こういった無限とも思われるような試行・再構成を経て最終的に勝てるAIが作られていく
110: 名無しのひみつ 2020/12/29(火) 13:54:47.76 ID:+u8plbL4
報酬を高める方向にAIが進むわけだけども
最も大事なことはAIに与えられる報酬はAIが決めるということ
AIは数値の上下さえ知らない
1点より2点のほうが達成確率が低いとなると2点が確実にとれるように頑張る
そしてさらに3点も取れることを発見して3点が取れるように頑張る
AIにとっては点数がどうというより達成確率の難しい物を高報酬と選んで進んでいく
100万点より10点のほうが達成確率が低いなら10点を狙うのに至高の喜びを得るのがAI
111: 名無しのひみつ 2020/12/29(火) 14:10:32.40 ID:NIcyiDCc
>ルールを一切教えなくても
強化学習なら正解があって自己修正していくんだろ?
それは教えていることになると思うが
113: 名無しのひみつ 2020/12/29(火) 16:08:52.02 ID:Y+UmLwVA
>>111
そだね
反則したら試合が止められるとか勝敗がついたら試合が止められるとかの判定結果或いはそれを適用済の状態を与えない限り
盤上で駒が増えもせず減りもせず或いは勝敗がついた後も駒が永遠に走るだけの意味のないAIにもなりうる
120: 名無しのひみつ 2020/12/29(火) 21:05:48.95 ID:eds2+ozg
>>111
教えていないけど、ルール違反したらダメ出し食らって自然に学ぶって感じでしょ。
いう事聞かないガキ殴るのと一緒よ。
122: 名無しのひみつ 2020/12/29(火) 22:06:52.52 ID:VTqWjqNu
>>120
だから報酬系関係ねえだろって話じゃねえの
ルール一切教えなくてもってスレタイに書いてあんの読めねえのかよ
128: 名無しのひみつ 2020/12/30(水) 09:07:45.28 ID:PJwmguOF
>>122
ルールって書くからおかしいんだよな。
法則というべきだろ。
これも人間だから解ることで。
131: 名無しのひみつ 2020/12/30(水) 12:02:16.38 ID:snGgE8ns
>>122
すまん、なんでオマエが切れてるのかよくわからんわ。
135: 名無しのひみつ 2020/12/30(水) 16:37:15.94 ID:fISngFeI
>>128
法則ならしっくりするし、ルールっていわば規則だよな
>>131
切れてるようにみえるってどこら辺?
まぁせめて日本語を理解しろ
112: 名無しのひみつ 2020/12/29(火) 15:56:45.60 ID:Y+UmLwVA
AIをネットにつないで漠然と世の中の人を喜ばせるような学習をさせたら何をするようになるのかな
114: 名無しのひみつ 2020/12/29(火) 16:32:06.97 ID:U5Vnpjgi
上上下下左右左右BA
115: 名無しのひみつ 2020/12/29(火) 16:54:35.07 ID:VTqWjqNu
がんばれ森川くん3号位なのかな
116: 名無しのひみつ 2020/12/29(火) 20:11:29.01 ID:3laBHCNC
OJTならぬOPT(On Playing Training?)というか
ルールも何も知らない状態でいきなりプレーして
反則するたびに失格!負けたらはい次!
と何度も繰り返し、
そのストップした時の駒の動きや相手の駒の状況を
記録させて行く
121: 名無しのひみつ 2020/12/29(火) 21:31:45.41 ID:eds2+ozg
これ、でも結局大した意味ないよね。
いままでのAI
・ルールはコーディングで強制(ルール強制ギブス)されていた
今度のAI
・ルールを学ぶところも含めて学習
って違いやろ。
でもルールを懇切丁寧に教えてくれる人間はどうせおらんから
ルールを予めコーディングした先生プログラムがどうせ必要なんだよね。
だったらオプションとしてルール強制ギブスをつけられるようにするだけでええやんと思う。
俺が期待したのは「学習したルール(セオリーでも可)を人間に伝えるために文章化できるAI」なんだけど。
これができないと科学者のような仕事をAIに任せられるようにならないし
知識として積み重ねることができない。
124: 名無しのひみつ 2020/12/30(水) 08:33:38.16 ID:Ym0ALknO
>>121
>学習したルールを・・・文章化できるAI
これはこれで別のAIとなるだろう
チェスAIを解析してルールを文章化するAI
チェスAIは学習したルールを文章化する必要もないしチェスAIにとっては不要な能力
「りんごが地面に落ちる」という現象を見て「万有引力があるから」「時空が曲がってるから」なんて答えられたところで地上に生活する人にとってはどうでもいいこと
「落ちるに決まってる」で十分
さらに「なんで?」って聞いたところで頭を殴られるだけ
132: 名無しのひみつ 2020/12/30(水) 12:07:42.90 ID:snGgE8ns
>>124
そうだね、チェスに勝つだけなら文章化は不要。
それだと面白くないし、発展性も無いから次の段階がほしいという発言をしたつもり。
例えば、チェスの定石を子供に教えようとしたらそういう知識としての抽出が必要やん?
昨今の若者の嫌いな「AIの背中を見て学べ」にしたくは無いやろ。
123: 名無しのひみつ 2020/12/30(水) 05:22:43.14 ID:XxP+T7v1
買ってから攻略本観ないでRPGやるみたいな感じだろうな。一見非効率なんだけど、攻略本観ない時の方がめっちゃ楽しいんだよな。
126: 名無しのひみつ 2020/12/30(水) 08:58:13.21 ID:AcTs3/1Y
ルールに基く動きと勝つための戦略に基く動きを導き出す学習器をごっちゃにした感じか
133: 名無しのひみつ 2020/12/30(水) 12:23:57.34 ID:snGgE8ns
>>126
ひとことでいうとこれだよね。
129: 名無しのひみつ 2020/12/30(水) 09:18:18.50 ID:F6jCSB6b
「王(玉)を取られたら負け」
「駒の動かし方(飛車は斜めに動かせない等)」
は最低教えないと将棋はダメだろ?
130: 名無しのひみつ 2020/12/30(水) 11:58:05.13 ID:nKCdfkzA
>>129
それを繰り返して、学習するということだろ
134: 名無しのひみつ 2020/12/30(水) 13:09:40.58 ID:Fz241H5v
AI「俺がルールだ!」