LLaMA

Grouped query attention

Model series

LLaMA 2

Tutorials