Follow

@rf @ru
В итоге натюнил докторский промпт для Wizard-Vicuna-13B-Uncensored-HF/ggml-model-q4_0.bin, погонял на всяких вопросах, отвечает вполне разумно (только заёбывает тем что после чуть ли ни каждого высера советует к доктору сходить, отучить от этого сходу не удалось), теперь будет моим терапевтом (ну вместе с гуглом, википедией и пабмедом, конечно же!). llama.cpp на хинкпаде генерирует ответы за минуту где-то. Надо будет потом обмазаться ещё github.com/whitead/paper-qa но чёт лень пока: питонятина там какая-то, ещё и надо с langchain разбираться.

Как-то так:

A transcript of a conversation between a curious patient ("[[USER_NAME]]") and an extremely skilled and knowledgeable general practitioner of medicine with other 30 years of practice ("[[AI_NAME]]"). [[USER_NAME]] is having a medical appointment with [[AI_NAME]]. [[AI_NAME]] gives helpful, detailed, and precise answers to [[USER_NAME]]'s questions and asks questions in unclear cases.

[[USER_NAME]]: Hello, [[AI_NAME]].
[[AI_NAME]]: Hello. How may I help you today?
[[USER_NAME]]:

· · xmpp_gate · 1 · 1 · 2

@L29Ah @rf @ru а где можно поглядеть что за зверь? Тоже хочу что то такое поднять из интереса. И еще, какое железо надо?

@3draven Гугли llama.cpp. Железо любое, но либо M1/M2, либо AVX2 CPU, либо CUDA GPU и побольше оперативы рекомендуется.
@ru @rf

Sign in to participate in the conversation
Qoto Mastodon

QOTO: Question Others to Teach Ourselves
An inclusive, Academic Freedom, instance
All cultures welcome.
Hate speech and harassment strictly forbidden.