Posts
All the articles I've posted.
-
强化学习中的数学原理(二):贝尔曼最优方程与迭代算法
Mathematical Principles in Reinforcement Learning summary part 2 - Bellman Optimality Equation and Value/Policy Iteration
-
cs285
cs285 summary
-
强化学习中的数学原理(一):马尔可夫决策过程与贝尔曼方程
Mathematical Principles in Reinforcement Learning summary
-
拓荒
转变博客主题之后的第一篇博客,对转瞬即逝的大学前两年的反思与总结