Large Language Models Are Implicitly Topic Models: Explaining and Finding Good Demonstrations for In-Context Learning. (arXiv:2301.11916v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2301.11916 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

SeqDiffuSeq: Text Diffusion with Encoder-Decoder Transformers. (arXiv:2212.10325v3 [cs.CL] UPDATED)

http://arxiv.org/abs/2212.10325 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

Reasoning with Language Model Prompting: A Survey. (arXiv:2212.09597v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2212.09597 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

I2D2: Inductive Knowledge Distillation with NeuroLogic and Self-Imitation. (arXiv:2212.09246v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2212.09246 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

Summary-Oriented Vision Modeling for Multimodal Abstractive Summarization. (arXiv:2212.07672v2 [cs.CV] UPDATED)

http://arxiv.org/abs/2212.07672 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

Solving Math Word Problems via Cooperative Reasoning induced Language Models. (arXiv:2210.16257v3 [cs.CL] UPDATED)

http://arxiv.org/abs/2210.16257 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

Is It Worth the (Environmental) Cost? Limited Evidence for Temporal Adaptation via Continuous Training. (arXiv:2210.07365v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2210.07365 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

Few-shot Incremental Event Detection. (arXiv:2209.01979v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2209.01979 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

Modular and On-demand Bias Mitigation with Attribute-Removal Subnetworks. (arXiv:2205.15171v4 [cs.LG] UPDATED)

http://arxiv.org/abs/2205.15171 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

MiniDisc: Minimal Distillation Schedule for Language Model Compression. (arXiv:2205.14570v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2205.14570 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

ECOLA: Enhanced Temporal Knowledge Embeddings with Contextualized Language Representations. (arXiv:2203.09590v5 [cs.CL] UPDATED)

http://arxiv.org/abs/2203.09590 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

QNLP in Practice: Running Compositional Models of Meaning on a Quantum Computer. (arXiv:2102.12846v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2102.12846 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

Personalize Segment Anything Model with One Shot. (arXiv:2305.03048v1 [cs.CV])

http://arxiv.org/abs/2305.03048 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

Principle-Driven Self-Alignment of Language Models from Scratch with Minimal Human Supervision. (arXiv:2305.03047v1 [cs.LG])

http://arxiv.org/abs/2305.03047 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

What changes when you randomly choose BPE merge operations? Not much. (arXiv:2305.03029v1 [cs.CL])

http://arxiv.org/abs/2305.03029 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

**arXiv - CSCL** @arxiv_cscl@qoto.org · May 05, 2023, 03:07

May 05, 2023, 03:07

arXiv - CSCL @arxiv_cscl@qoto.org

Panda LLM: Training Data and Evaluation for Open-Sourced Chinese Instruction-Following Large Language Models. (arXiv:2305.03025v1 [cs.CL])

http://arxiv.org/abs/2305.03025 #arXiv #NLProc

Show older

Bot

All recent Computation and Language articles on arXiv.org for the Fediverse

Inspired by https://twitter.com/arxiv_cscl

Joined Nov 2022

arXiv - CSCL @arxiv_cscl@qoto.org

Resources

Developers

What is Mastodon?

qoto.org

More…