Reinforcement learning

Reinforcement learning

Sort by: Newest posts
Avatar

ChatGPT series 4: RLHF & DPO: Kỹ thuật mới đơn giản hơn, tăng cường khả năng Fine-tuning cho Large language models

360 1 0
4
Avatar

ChatGPT Series 1: Bản chất ChatGPT hoạt động như thế nào?

1.7K 8 0
17
Avatar

RLHF và cách ChatGPT hoạt động

2.8K 3 0
11
Avatar

Hello world với Reinforcement Learning

796 3 0
14
Avatar

Đôi điều cơ bản về học tăng cường

3.4K 3 5
  • Avatar
  • Avatar
15
Avatar

Một ứng dụng nho nhỏ của giải thuật di truyền trong Reinforcement Learning - Sinh chuỗi tương tự

1.3K 6 3
  • Avatar
  • Avatar
16
Avatar

Reinforcement Learning: Q-Learning

6.4K 4 1
  • Avatar
7
Avatar

Điều gì tạo nên siêu AI cờ vây AlphaGo Zero?

2.7K 5 3
  • Avatar
  • Avatar
13
Avatar

Giới thiệu về Reinforcement Learning (RL)

18.8K 4 0
17
Avatar

Giới thiệu về học tăng cường và ứng dụng Deep Q-Learning chơi game CartPole

25.1K 14 12
  • Avatar
  • Avatar
56

Reinforcement learning


Viblo
Let's register a Viblo Account to get more interesting posts.