¥Ç¥£¡¼¥×¥é¡¼¥Ë¥ó¥°(¿¼Áسؽ¬)¤Ç¥¥ã¥é¥¯¥¿¡¼¤ò¶¯¤¯¤¹¤ë¡ª
Unity³¦¤Ç¤¤¤ÞºÇ¤â¥Û¥Ã¥È¤ÊÏÃÂê¡ÖUnity ML-Agents¡×¤ò ¥¹¥Æ¥Ã¥×¡¦¥Ð¥¤¡¦¥¹¥Æ¥Ã¥×¤Ç³Ø¤Ù¤ë1ºý¡ª
¥²¡¼¥àÀ©ºî¤Ç¡¢µ¡³£³Ø½¬¡¦¶¯²½³Ø½¬¤ò³èÍѤ¹¤ë¤¿¤á¤ÎºÇ½é¤Î°ìÊ⡪
¡ÖUnity ML-Agents¡×¤Ï¡¢2017ǯ½©¤Ëv0.1¤È¤·¤ÆÅоì°Ê¹ß¡¢½çÄ´¤Ë¥Ð¡¼¥¸¥ç¥ó¥¢¥Ã¥×¤ò½Å¤Í¡¢2020ǯ5·î¤Ë¤Ä¤¤¤ËÀµ¼°ÈǤȤʤê¤Þ¤·¤¿¡£º£¸å¤Ï¡¢Unity¤ÎÃæ³Ëµ¡Ç½¤Î1¤Ä¤Ë¤Ê¤ë¤ÈͽÁÛ¤µ¤ì¤Æ¤¤¤Þ¤¹¡£
Ëܽñ¤Ï¡¢2018ǯ7·î¤Ë´©¹Ô¤·¤¿Á°½ñ¡Êv0.4¤ËÂбþ¡Ë¤ò¡¢Àµ¼°ÈǤ˹ç¤ï¤»¤ÆÁ´ÌÌŪ¤Ë²þÄû¤·¤¿¤â¤Î¤Ç¤¹¡£
Unity ML-Agents¤Ï¡¢Â¿¤¯¤ÎAI¥×¥í¥°¥é¥ß¥ó¥°¤Çɬ¿Ü¤È¤Ê¤ë¡ÖPython¡×¤Î¥³¡¼¥Ç¥£¥ó¥°¤òɬÍפȤ»¤º¡¢Unity ML-Agents¤Î»ÅÁȤߤ˱è¤Ã¤Æ¡¢Ä̾ï¤Î¥²¡¼¥à³«È¯Æ±ÍͤËC#¤Ë¤è¤ë¥³¡¼¥Ç¥£¥ó¥°¤Ç´°·ë¤Ç¤¤ë¤³¤È¤¬Â礤ÊÆÃħ¤Ç¤¹¡£
Ëܽñ¤Ç¤Ï¡¢¤³¤ì¤«¤é¥²¡¼¥àAI¤Ë¤Ä¤¤¤Æ³Ø¤Ó¤¿¤¤Êý¤«¤éÆɤó¤Ç¤¤¤¿¤À¤±¤ë¤è¤¦¤Ë¡¢µ¡³£³Ø½¬¤Î´ðÁ䫤é³Ø½¬´Ä¶¤Î¹½ÃÛ¡¢ÉÕ°¥µ¥ó¥×¥ë¤Ë¤è¤ë¤µ¤Þ¤¶¤Þ¤Ê³Ø½¬ÊýË¡¤Î²òÀâ¤Ê¤É¤ò¡¢¥¹¥Æ¥Ã¥×¡¦¥Ð¥¤¡¦¥¹¥Æ¥Ã¥×¤Ç¼ÂÁ©Åª¤Ë½¬ÆÀ¤Ç¤¤ë¤è¤¦¤Ë¹½À®¤·¤Æ¤¤¤Þ¤¹¡£
¤Þ¤¿¡¢¼ÂºÝ¤Î³«È¯¸½¾ì¤Ç¥²¡¼¥àAI¤ò³èÍѤ¹¤ë¤¿¤á¤Î¥µ¥ó¥×¥ë¤È¤·¤Æ¡¢Unity¤¬Ìµ½þ¤Ç¸ø³«¤·¤Æ¤¤¤ë¥²¡¼¥à¤ò»È¤Ã¤Æ¡¢¡Ö¥Æ¥¹¥È¤Î¼«Æ°²½¡×¡Ö¥²¡¼¥à¥Ð¥é¥ó¥¹¤ÎÄ´À°¡×¡Ö¤è¤ê¼«Á³¤Ê¿¶¤ëÉñ¤¤¤ò¹Ô¤¦NPC¡×¡Ö¿Í´Ö¤ÎÂå¤ï¤ê¤È¤Ê¤ëÂÐÀïÁê¼ê¡×¤òAI¤È¤·¤Æ¼ÂÁõ¤·¤¿¥µ¥ó¥×¥ë»öÎã¤â¾Ò²ð¤·¤Æ¤¤¤Þ¤¹¡£
Ëܽñ¤Ï¡¢´ðÁ䫤é¼ÂÁ©¤Þ¤ÇÌÖÍ夷¤Æ¤ª¤ê¡¢¤³¤ì¤«¤é¥²¡¼¥àAI¤Ë¥Á¥ã¥ì¥ó¥¸¤·¤¿¤¤Êý¤Ë¤ª´«¤á¤·¤¿¤¤1ºý¤Ç¤¹¡£
1¾Ï µ¡³£³Ø½¬¤ÈUnity ML-Agents¤Î³µÍ×
¡¡1-1 ¿Í¹©ÃÎǽ¤Èµ¡³£³Ø½¬
¡¡1-2 ¶µ»Õ¤¢¤ê³Ø½¬¤È¶µ»Õ¤Ê¤·³Ø½¬¤È¶¯²½³Ø½¬
¡¡1-3 ¶¯²½³Ø½¬
¡¡1-4 ¶¯²½³Ø½¬¤Î³Ø½¬¥¢¥ë¥´¥ê¥º¥à
¡¡1-5 Unity ML-Agents¤Î³µÍ×
¡¡1-6 Unity ML-Agents¤Î³Ø½¬¥·¥Ê¥ê¥ª
2¾Ï ¤Ï¤¸¤á¤Æ¤Î³Ø½¬´Ä¶¤ÎºîÀ®
¡¡2-1 ³«È¯´Ä¶¤Î½àÈ÷
¡¡2-2 ¥×¥í¥¸¥§¥¯¥È¤Î½àÈ÷
¡¡2-3 ¤Ï¤¸¤á¤Æ¤Î³Ø½¬´Ä¶¤ÎºîÀ®
¡¡2-4 ³Ø½¬¤È¿äÏÀ
¡¡2-5 ³Ø½¬¤Î¹â®²½
3¾Ï Unity ML-Agents¤Î´ðÁÃ
¡¡3-1 ¾õÂ֤ȴѻ¡
¡¡3-2 ¹ÔÆ°
¡¡3-3 Ê󽷤ȥ¨¥Ô¥½¡¼¥É´°Î»
¡¡3-4 ·èÄê
¡¡3-5 ·±ÎýÀßÄê¥Õ¥¡¥¤¥ë
¡¡3-6 mlagents-learn
¡¡3-7 TensorBoard
4¾Ï ¤µ¤Þ¤¶¤Þ¤Ê³Ø½¬ÊýË¡
¡¡4-1 SAC
¡¡4-2 Discrete
¡¡4-3 Visual Observation
¡¡4-4 Raycast Observation
¡¡4-5 ¥»¥ë¥Õ¥×¥ì¥¤
¡¡4-6 Curiosity
¡¡4-7 ÌÏÊï³Ø½¬
¡¡4-8 LSTM¡ÊLong Short-Term Memory¡Ë
¡¡4-9 ¥«¥ê¥¥å¥é¥à³Ø½¬
¡¡4-10 ´Ä¶¥Ñ¥é¥á¡¼¥¿¤Î¥é¥ó¥À¥à²½
¡¡4-11 Observable°À
5¾Ï ¥µ¥ó¥×¥ë¤Î³Ø½¬´Ä¶
¡¡5-1 ¥µ¥ó¥×¥ë³Ø½¬´Ä¶¤Î½àÈ÷
¡¡5-2 FoodCollector¡ÊObservation¡Ë
¡¡5-3 GridWorld¡ÊVisual Observation¡Ë
¡¡5-4 PushBlock¡ÊRaycast Observation¡Ë
¡¡5-5 Tennis¡Ê¥»¥ë¥Õ¥×¥ì¥¤¡¡Ë
¡¡5-6 Soccer¡Ê¥»¥ë¥Õ¥×¥ì¥¤¢¡Ë
¡¡5-7 Pyramids¡ÊCuriosity¡¦ÌÏÊï³Ø½¬¡Ë
¡¡5-8 Hallway¡ÊLSTM¡Ë
¡¡5-9 WallJump¡Ê¥«¥ê¥¥å¥é¥à³Ø½¬¡Ë
¡¡5-10 3DBall¡Ê´Ä¶¥Ñ¥é¥á¡¼¥¿¤Î¥é¥ó¥À¥à²½¡Ë
¡¡5-11 Bouncer¡ÊRequestDecision¡Ë
¡¡5-12 Reacher¡Ê¿´ØÀá¤Î³Ø½¬¡¡Ë
¡¡5-13 Worm¡Ê¿´ØÀá¤Î³Ø½¬¢¡Ë
¡¡5-14 Crawler¡Ê¿´ØÀá¤Î³Ø½¬£¡Ë
¡¡5-15 Walker¡Ê¿´ØÀá¤Î³Ø½¬¤¡Ë
¡¡5-16 Basic¡Ê¥«¥¹¥¿¥à¥»¥ó¥µ¡¼¥³¥ó¥Ý¡¼¥Í¥ó¥È¡Ë
6¾Ï ¥²¡¼¥à³«È¯¤Ë¤ª¤±¤ë¶¯²½³Ø½¬¤Î³èÍÑ
¡¡6-1 ¥²¡¼¥à³«È¯¤Ç¤Î¶¯²½³Ø½¬¥¨¡¼¥¸¥§¥ó¥È¤Î³èÍÑ
¡¡6-2 Flappy Bird Style¡Ý¥Æ¥¹¥È¤Î¼«Æ°²½
¡¡6-3 3D Game Kit Lite¡Ý¥³¥ó¥Æ¥ó¥Ä¤Î¥Ð¥é¥ó¥¹Ä´À°¤Î¥µ¥Ý¡¼¥È
¡¡6-4 Puppo, The Corgi¡Ý¤è¤ê¼«Á³¤Ê¿¶¤ëÉñ¤¤¤ò¹Ô¤¦NPC
¡¡6-5 Karting Microgame¡Ý¿Í´Ö¤ÎÂå¤ï¤ê¤È¤Ê¤ëÂÐÀïÁê¼ê
¡¡6-6 Unity Analytics¤Ë¤è¤ë¥¨¡¼¥¸¥§¥ó¥È¤Î¹ÔÆ°²òÀÏ
7¾Ï Python API¤ò»È¤Ã¤¿³Ø½¬´Ä¶¤Î¹½ÃÛ
¡¡7-1 Python API¤ò»È¤Ã¤¿³Ø½¬
¡¡7-2 Gym¥é¥Ã¥Ñ¡¼
¡¡7-3 Python Low Level API
¡¡7-4 ¥µ¥¤¥É¥Á¥ã¥Í¥ë
¡¡7-5 ¥«¥¹¥¿¥à¥µ¥¤¥É¥Á¥ã¥Í¥ë