Study Notes

❯

❯

Neural Network Function Approximation

Neural Network Function Approximation

Jun 06, 20261 min read

approximation
deep-rl

Neural Network Function Approximation

Neural Network Function Approximation

Using neural networks as non-linear function approximators for value functions or policies: $\overset{v}{^} (s, θ) = f_{θ} (s)$ where $f$ is a neural network with parameters $θ$ .

Advantages over Linear FA

Automatic feature learning: No manual Feature Construction needed
Representational power: Can approximate any continuous function (universal approximation theorem)
Handles raw inputs: Can process pixels, text, etc. directly

Challenges in RL

No convergence guarantees for Semi-Gradient Methods with non-linear FA
Deadly Triad becomes more dangerous — non-linear + bootstrapping + off-policy
Non-stationarity: Target values change as policy improves
Catastrophic forgetting: Updating for new states can degrade performance on old states

Stabilization techniques: Experience Replay, Target Network (as in Deep Q-Network (DQN))

Appears In

RL-L06 - On-Policy TD with Approximation (§9.7), RL-L08 - Deep RL Value-Based

Graph View

Neural Network Function Approximation
Advantages over Linear FA
Challenges in RL
Appears In

Backlinks

Convolutional Neural Networks
Deep Q-Network (DQN)
Feature Construction
Fourier Basis
Function Approximation
Recurrent Neural Network (RNN)
Semi-Gradient Methods
RL-Book Ch9 - On-Policy Prediction with Approximation
RL-L06 - On-Policy TD with Approximation
RL-L14 - Recap

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community