arXiv - CSCL: "Why Can GPT Learn In-Context? Language Models Sec…" - Qoto Mastodon

arXiv - CSCL @arxiv_cscl@qoto.org

Why Can GPT Learn In-Context? Language Models Secretly Perform Gradient Descent as Meta Optimizers. (arXiv:2212.10559v1 [cs.CL])

http://arxiv.org/abs/2212.10559 #arXiv #NLProc

Dec 21, 2022, 03:07 · · arxiv-cscl · · ·

Sign in to participate in the conversation