<?xml version="1.0"?>
<oembed><version>1.0</version><provider_name>&#xB77C;&#xC774;&#xBE0C;&#xC2A4;&#xB9C8;&#xD2B8;</provider_name><provider_url>https://atmokpo.com/w</provider_url><author_name>root</author_name><author_url>https://atmokpo.com/w/author/root/</author_url><title>37. Python&#xC744; &#xD65C;&#xC6A9;&#xD55C; &#xAC15;&#xD654;&#xD559;&#xC2B5; &#xD658;&#xACBD; &#xAD6C;&#xCD95; &#xBC0F; &#xC5D0;&#xC774;&#xC804;&#xD2B8; &#xD559;&#xC2B5;, OpenAI Gym &#xB4F1; RL &#xD658;&#xACBD; &#xC124;&#xC815; &#xBC29;&#xBC95; - &#xB77C;&#xC774;&#xBE0C;&#xC2A4;&#xB9C8;&#xD2B8;</title><type>rich</type><width>600</width><height>338</height><html>&lt;blockquote class="wp-embedded-content" data-secret="W1SQrDlxxY"&gt;&lt;a href="https://atmokpo.com/w/40498/"&gt;37. Python&#xC744; &#xD65C;&#xC6A9;&#xD55C; &#xAC15;&#xD654;&#xD559;&#xC2B5; &#xD658;&#xACBD; &#xAD6C;&#xCD95; &#xBC0F; &#xC5D0;&#xC774;&#xC804;&#xD2B8; &#xD559;&#xC2B5;, OpenAI Gym &#xB4F1; RL &#xD658;&#xACBD; &#xC124;&#xC815; &#xBC29;&#xBC95;&lt;/a&gt;&lt;/blockquote&gt;&lt;iframe sandbox="allow-scripts" security="restricted" src="https://atmokpo.com/w/40498/embed/#?secret=W1SQrDlxxY" width="600" height="338" title="&#x201C;37. Python&#xC744; &#xD65C;&#xC6A9;&#xD55C; &#xAC15;&#xD654;&#xD559;&#xC2B5; &#xD658;&#xACBD; &#xAD6C;&#xCD95; &#xBC0F; &#xC5D0;&#xC774;&#xC804;&#xD2B8; &#xD559;&#xC2B5;, OpenAI Gym &#xB4F1; RL &#xD658;&#xACBD; &#xC124;&#xC815; &#xBC29;&#xBC95;&#x201D; &#x2014; &#xB77C;&#xC774;&#xBE0C;&#xC2A4;&#xB9C8;&#xD2B8;" data-secret="W1SQrDlxxY" frameborder="0" marginwidth="0" marginheight="0" scrolling="no" class="wp-embedded-content"&gt;&lt;/iframe&gt;&lt;script&gt;
/*! This file is auto-generated */
!function(d,l){"use strict";l.querySelector&amp;&amp;d.addEventListener&amp;&amp;"undefined"!=typeof URL&amp;&amp;(d.wp=d.wp||{},d.wp.receiveEmbedMessage||(d.wp.receiveEmbedMessage=function(e){var t=e.data;if((t||t.secret||t.message||t.value)&amp;&amp;!/[^a-zA-Z0-9]/.test(t.secret)){for(var s,r,n,a=l.querySelectorAll('iframe[data-secret="'+t.secret+'"]'),o=l.querySelectorAll('blockquote[data-secret="'+t.secret+'"]'),c=new RegExp("^https?:$","i"),i=0;i&lt;o.length;i++)o[i].style.display="none";for(i=0;i&lt;a.length;i++)s=a[i],e.source===s.contentWindow&amp;&amp;(s.removeAttribute("style"),"height"===t.message?(1e3&lt;(r=parseInt(t.value,10))?r=1e3:~~r&lt;200&amp;&amp;(r=200),s.height=r):"link"===t.message&amp;&amp;(r=new URL(s.getAttribute("src")),n=new URL(t.value),c.test(n.protocol))&amp;&amp;n.host===r.host&amp;&amp;l.activeElement===s&amp;&amp;(d.top.location.href=t.value))}},d.addEventListener("message",d.wp.receiveEmbedMessage,!1),l.addEventListener("DOMContentLoaded",function(){for(var e,t,s=l.querySelectorAll("iframe.wp-embedded-content"),r=0;r&lt;s.length;r++)(t=(e=s[r]).getAttribute("data-secret"))||(t=Math.random().toString(36).substring(2,12),e.src+="#?secret="+t,e.setAttribute("data-secret",t)),e.contentWindow.postMessage({message:"ready",secret:t},"*")},!1)))}(window,document);
//# sourceURL=https://atmokpo.com/w/wp-includes/js/wp-embed.min.js
&lt;/script&gt;
</html><description>1. &#xAC15;&#xD654;&#xD559;&#xC2B5;(RL) &#xC18C;&#xAC1C; &#xAC15;&#xD654;&#xD559;&#xC2B5;( Reinforcement Learning, RL)&#xC740; &#xC5D0;&#xC774;&#xC804;&#xD2B8;&#xAC00; &#xD658;&#xACBD;&#xACFC; &#xC0C1;&#xD638;&#xC791;&#xC6A9;&#xD558;&#xBA74;&#xC11C; &#xBCF4;&#xC0C1;&#xC744; &#xCD5C;&#xB300;&#xD654;&#xD558;&#xB294; &#xBC29;&#xD5A5;&#xC73C;&#xB85C; &#xD559;&#xC2B5;&#xD558;&#xB294; &#xBC29;&#xBC95;&#xC785;&#xB2C8;&#xB2E4;. &#xC774; &#xACFC;&#xC815;&#xC5D0;&#xC11C; &#xC5D0;&#xC774;&#xC804;&#xD2B8;&#xB294; &#xC561;&#xC158;&#xC744; &#xC120;&#xD0DD;&#xD558;&#xACE0;, &#xD658;&#xACBD;&#xC73C;&#xB85C;&#xBD80;&#xD130; &#xBCF4;&#xC0C1;&#xACFC; &#xB2E4;&#xC74C; &#xC0C1;&#xD0DC;&#xB97C; &#xBC1B;&#xACE0;, &#xC774;&#xB97C; &#xD1B5;&#xD574; &#xC815;&#xCC45;(policy)&#xC744; &#xAC1C;&#xC120;&#xD569;&#xB2C8;&#xB2E4;. RL&#xC744; &#xC774;&#xD574;&#xD558;&#xAE30; &#xC704;&#xD574;&#xC11C;&#xB294; &#xBA87; &#xAC00;&#xC9C0; &#xD575;&#xC2EC; &#xAC1C;&#xB150;&#xC744; &#xC775;&#xD600;&#xC57C; &#xD569;&#xB2C8;&#xB2E4;: &#xD658;&#xACBD;(Environment): &#xC5D0;&#xC774;&#xC804;&#xD2B8;&#xAC00; &#xC0C1;&#xD638;&#xC791;&#xC6A9;&#xD558;&#xB294; &#xB300;&#xC0C1;&#xC785;&#xB2C8;&#xB2E4;. RL &#xBB38;&#xC81C;&#xB97C; &#xC815;&#xC758;&#xD558;&#xB294; &#xB370; &#xC911;&#xC694;&#xD55C; &#xC694;&#xC18C;&#xC785;&#xB2C8;&#xB2E4;. &#xC0C1;&#xD0DC;(State): &#xC5D0;&#xC774;&#xC804;&#xD2B8;&#xAC00; &#xD604;&#xC7AC; &#xD658;&#xACBD;&#xC5D0;&#xC11C; &#xAD00;&#xCE21;&#xD558;&#xB294; &#xC815;&#xBCF4;&#xC785;&#xB2C8;&#xB2E4;. &#xD589;&#xB3D9;(Action): &hellip; &#xB354; &#xBCF4;&#xAE30; ""</description></oembed>
