Lexical Repetitions Lead to Rote Learning: Unveiling the Impact of Lexical Overlap in Train and Test Reference Summaries. (arXiv:2311.09458v1 [cs.CL])

http://arxiv.org/abs/2311.09458 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

Nov 19, 2023, 03:18

arXiv - CSCL @arxiv_cscl@qoto.org

How Trustworthy are Open-Source LLMs? An Assessment under Malicious Demonstrations Shows their Vulnerabilities. (arXiv:2311.09447v1 [cs.CL])

http://arxiv.org/abs/2311.09447 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

Nov 19, 2023, 03:18

arXiv - CSCL @arxiv_cscl@qoto.org

Subtle Misogyny Detection and Mitigation: An Expert-Annotated Dataset. (arXiv:2311.09443v1 [cs.CL])

http://arxiv.org/abs/2311.09443 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

Nov 19, 2023, 03:18

arXiv - CSCL @arxiv_cscl@qoto.org

Labeled Interactive Topic Models. (arXiv:2311.09438v1 [cs.LG])

http://arxiv.org/abs/2311.09438 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

Nov 19, 2023, 03:18

arXiv - CSCL @arxiv_cscl@qoto.org

Backdoor Activation Attack: Attack Large Language Models using Activation Steering for Safety-Alignment. (arXiv:2311.09433v1 [cs.CR])

http://arxiv.org/abs/2311.09433 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

Nov 19, 2023, 03:18

arXiv - CSCL @arxiv_cscl@qoto.org

Striped Attention: Faster Ring Attention for Causal Transformers. (arXiv:2311.09431v1 [cs.LG])

http://arxiv.org/abs/2311.09431 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

Nov 19, 2023, 03:18

arXiv - CSCL @arxiv_cscl@qoto.org

Beyond Detection: Unveiling Fairness Vulnerabilities in Abusive Language Models. (arXiv:2311.09428v1 [cs.CL])

http://arxiv.org/abs/2311.09428 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

Nov 19, 2023, 03:18

arXiv - CSCL @arxiv_cscl@qoto.org

Predicting generalization performance with correctness discriminators. (arXiv:2311.09422v1 [cs.CL])

http://arxiv.org/abs/2311.09422 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

Nov 19, 2023, 03:18

arXiv - CSCL @arxiv_cscl@qoto.org

When Large Language Models contradict humans? Large Language Models' Sycophantic Behaviour. (arXiv:2311.09410v1 [cs.CL])

http://arxiv.org/abs/2311.09410 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

Nov 19, 2023, 03:18

arXiv - CSCL @arxiv_cscl@qoto.org

Alternatives to the Scaled Dot Product for Attention in the Transformer Neural Network Architecture. (arXiv:2311.09406v1 [cs.LG])

http://arxiv.org/abs/2311.09406 #arXiv #NLProc

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

**arXiv - CSCL** @arxiv_cscl@qoto.org · Nov 19, 2023, 03:18

Nov 19, 2023, 03:18

arXiv - CSCL @arxiv_cscl@qoto.org

To Translate or Not to Translate: A Systematic Investigation of Translation-Based Cross-Lingual Transfer to Low-Resource Languages. (arXiv:2311.09404v1 [cs.CL])

http://arxiv.org/abs/2311.09404 #arXiv #NLProc