Frontier Language Models are not Robust to Adversarial Arithmetic, or "What do I need to say so you agree 2+2=5?. (arXiv:2311.07587v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2311.07587 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

Nov 18, 2023, 03:19

arXiv - CSCL @arxiv_cscl@qoto.org

InCA: Rethinking In-Car Conversational System Assessment Leveraging Large Language Models. (arXiv:2311.07469v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2311.07469 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

Nov 18, 2023, 03:19

arXiv - CSCL @arxiv_cscl@qoto.org

Are We Falling in a Middle-Intelligence Trap? An Analysis and Mitigation of the Reversal Curse. (arXiv:2311.07468v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2311.07468 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

Nov 18, 2023, 03:19

arXiv - CSCL @arxiv_cscl@qoto.org

Exploring the Dialogue Comprehension Ability of Large Language Models. (arXiv:2311.07194v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2311.07194 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

Nov 18, 2023, 03:19

arXiv - CSCL @arxiv_cscl@qoto.org

Comparative Multi-View Language Grounding. (arXiv:2311.06694v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2311.06694 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

Nov 18, 2023, 03:19

arXiv - CSCL @arxiv_cscl@qoto.org

ALYMPICS: Language Agents Meet Game Theory. (arXiv:2311.03220v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2311.03220 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

Nov 18, 2023, 03:19

arXiv - CSCL @arxiv_cscl@qoto.org

Incorporating Worker Perspectives into MTurk Annotation Practices for NLP. (arXiv:2311.02802v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2311.02802 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

Nov 18, 2023, 03:19

arXiv - CSCL @arxiv_cscl@qoto.org

Support or Refute: Analyzing the Stance of Evidence to Detect Out-of-Context Mis- and Disinformation. (arXiv:2311.01766v3 [cs.CL] UPDATED)

http://arxiv.org/abs/2311.01766 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

Nov 18, 2023, 03:19

arXiv - CSCL @arxiv_cscl@qoto.org

Construction Artifacts in Metaphor Identification Datasets. (arXiv:2311.00790v2 [cs.CL] UPDATED)

http://arxiv.org/abs/2311.00790 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

Nov 18, 2023, 03:19

arXiv - CSCL @arxiv_cscl@qoto.org

DEFT: Data Efficient Fine-Tuning for Large Language Models via Unsupervised Core-Set Selection. (arXiv:2310.16776v3 [cs.CL] UPDATED)

http://arxiv.org/abs/2310.16776 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 18, 2023, 03:19

Nov 18, 2023, 03:19

arXiv - CSCL @arxiv_cscl@qoto.org

Evaluating the Symbol Binding Ability of Large Language Models for Multiple-Choice Questions in Vietnamese General Education. (arXiv:2310.12059v3 [cs.CL] UPDATED)

http://arxiv.org/abs/2310.12059 #arXiv #NLProc