<?xml version="1.0" encoding="UTF-8" ?>
<rss
    version="2.0"
    xmlns:atom="http://www.w3.org/2005/Atom"
    xmlns:content="http://purl.org/rss/1.0/modules/content/"
    xmlns:webfeeds="http://webfeeds.org/rss/1.0"
    xmlns:media="http://search.yahoo.com/mrss/"
    >
    <channel>
        <title>Reinforcementlearning Tag - Viblo</title>
        <link>https://viblo.asia/rss</link>
        <description><![CDATA[Free service for technical knowledge sharing]]></description>
        <atom:link href="https://viblo.asia/rss/tags/reinforcementlearning.rss" rel="self"></atom:link>
                <copyright>Sun* Inc.</copyright>
                                                <webfeeds:logo>https://viblo.asia/logo_full.svg</webfeeds:logo>
        <image>
            <url>https://viblo.asia/logo_full.svg</url>
            <title>Reinforcementlearning Tag - Viblo</title>
            <link>https://viblo.asia/rss</link>
        </image>
                                <language>vi-vn</language>
        <lastBuildDate>2026-07-01T18:22:15+07:00</lastBuildDate>
                <item>
            <title><![CDATA[Nhập môn Reinforcement Learning: Kỷ nguyên Deep RL - Phá đảo Discrete với DQN và Continuous với DDPG]]></title>
                        <link>https://viblo.asia/p/nhap-mon-reinforcement-learning-ky-nguyen-deep-rl-pha-dao-discrete-voi-dqn-va-continuous-voi-ddpg-OXLA08PaJGr</link>
            <guid isPermaLink="true">https://viblo.asia/p/nhap-mon-reinforcement-learning-ky-nguyen-deep-rl-pha-dao-discrete-voi-dqn-va-continuous-voi-ddpg-OXLA08PaJGr</guid>
            <description><![CDATA[Nhập môn Reinforcement Learning: Kỷ nguyên Deep RL - Phá đảo Discrete với DQN và Continuous với DDPG

Chào mọi người, sau 9 tập ròng rã cày cuốc với c...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trần Đăng An</dc:creator>
            <pubDate>2026-07-01 10:10:47</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Nhập môn Reinforcement Learning: Continuous Control và Thuật toán REINFORCE (Policy Gradient)]]></title>
                        <link>https://viblo.asia/p/nhap-mon-reinforcement-learning-continuous-control-va-thuat-toan-reinforce-policy-gradient-Nj4vgwrdJ6r</link>
            <guid isPermaLink="true">https://viblo.asia/p/nhap-mon-reinforcement-learning-continuous-control-va-thuat-toan-reinforce-policy-gradient-Nj4vgwrdJ6r</guid>
            <description><![CDATA[Nhập môn Reinforcement Learning: Continuous Control và Thuật toán REINFORCE (Policy Gradient)

Chào mọi người, quay trở lại với series RL. Ở các tập t...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trần Đăng An</dc:creator>
            <pubDate>2026-07-01 09:58:36</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Nhập môn Reinforcement Learning: SARSA, Q-Learning và khái niệm On-policy vs Off-policy]]></title>
                        <link>https://viblo.asia/p/nhap-mon-reinforcement-learning-sarsa-q-learning-va-khai-niem-on-policy-vs-off-policy-1j4lQoRGJwl</link>
            <guid isPermaLink="true">https://viblo.asia/p/nhap-mon-reinforcement-learning-sarsa-q-learning-va-khai-niem-on-policy-vs-off-policy-1j4lQoRGJwl</guid>
            <description><![CDATA[Nhập môn Reinforcement Learning: SARSA, Q-Learning và khái niệm On-policy vs Off-policy

Chào mọi người, tiếp nối series, ở tập trước chúng ta đã thấy...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trần Đăng An</dc:creator>
            <pubDate>2026-07-01 09:33:04</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Nhập môn Reinforcement Learning: Monte Carlo Methods và Temporal-Difference (TD) Learning]]></title>
                        <link>https://viblo.asia/p/nhap-mon-reinforcement-learning-monte-carlo-methods-va-temporal-difference-td-learning-gdJzv57eJz5</link>
            <guid isPermaLink="true">https://viblo.asia/p/nhap-mon-reinforcement-learning-monte-carlo-methods-va-temporal-difference-td-learning-gdJzv57eJz5</guid>
            <description><![CDATA[Nhập môn Reinforcement Learning: Monte Carlo Methods và Temporal-Difference (TD) Learning

Chào mọi người. Ở tập trước, chúng ta đã thấy sự xịn xò của...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trần Đăng An</dc:creator>
            <pubDate>2026-06-30 21:33:51</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Nhập môn Reinforcement Learning: Dynamic Programming (Quy hoạch động)]]></title>
                        <link>https://viblo.asia/p/nhap-mon-reinforcement-learning-dynamic-programming-quy-hoach-dong-Nj4vgwzdJ6r</link>
            <guid isPermaLink="true">https://viblo.asia/p/nhap-mon-reinforcement-learning-dynamic-programming-quy-hoach-dong-Nj4vgwzdJ6r</guid>
            <description><![CDATA[Nhập môn Reinforcement Learning: Dynamic Programming (Quy hoạch động)

Chào mọi người, ở bài trước chúng ta đã mổ xẻ Value Functions và Bellman Equati...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trần Đăng An</dc:creator>
            <pubDate>2026-06-30 21:24:57</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Nhập môn Reinforcement Learning: Policies, Value Functions và Bellman Equations]]></title>
                        <link>https://viblo.asia/p/nhap-mon-reinforcement-learning-policies-value-functions-va-bellman-equations-lZL9XWbMJQK</link>
            <guid isPermaLink="true">https://viblo.asia/p/nhap-mon-reinforcement-learning-policies-value-functions-va-bellman-equations-lZL9XWbMJQK</guid>
            <description><![CDATA[Nhập môn Reinforcement Learning: Policies, Value Functions và Bellman Equations

Chào mọi người, ở bài trước chúng ta đã set up xong bộ khung của một ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trần Đăng An</dc:creator>
            <pubDate>2026-06-30 21:17:40</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Nhập môn Reinforcement Learning: Finite Markov Decision Processes (MDP)]]></title>
                        <link>https://viblo.asia/p/nhap-mon-reinforcement-learning-finite-markov-decision-processes-mdp-gdJzv573Jz5</link>
            <guid isPermaLink="true">https://viblo.asia/p/nhap-mon-reinforcement-learning-finite-markov-decision-processes-mdp-gdJzv573Jz5</guid>
            <description><![CDATA[Nhập môn Reinforcement Learning: Finite Markov Decision Processes (MDP)

Sau khi tìm hiểu và làm quen với các dạng bài toán bandit cơ bản ở phần trước...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trần Đăng An</dc:creator>
            <pubDate>2026-06-30 21:09:39</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Nhập môn Reinforcement Learning: Các kỹ thuật Bandit nâng cao &amp; Giới thiệu MDP]]></title>
                        <link>https://viblo.asia/p/nhap-mon-reinforcement-learning-cac-ky-thuat-bandit-nang-cao-gioi-thieu-mdp-bA468Q3lLKv</link>
            <guid isPermaLink="true">https://viblo.asia/p/nhap-mon-reinforcement-learning-cac-ky-thuat-bandit-nang-cao-gioi-thieu-mdp-bA468Q3lLKv</guid>
            <description><![CDATA[Nhập môn Reinforcement Learning: Các kỹ thuật Bandit nâng cao & Giới thiệu MDP

Chào mọi người, tiếp nối series bài viết về RL, ở phần trước chúng ta ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trần Đăng An</dc:creator>
            <pubDate>2026-06-30 20:54:31</pubDate>
                                                                                                        </item>
            </channel>
</rss>
