Habr

Разработка LLM моделей для обновления кода приложений на более высокие версии фреймворков или языков программирования

В этой статье я планирую исследовать, как можно использовать большие языковые модели (LLM) для миграции проектов между различными фреймворками. Применение LLM в задачах на уровне репозитория — это развивающаяся и всё более популярная область. Миграция кода со старых, устаревших фреймворков на новые является одной из ключевых задач в крупных корпоративных проектах.

habr.com/ru/articles/920424/

#llm #rl #expressjs #nestjs #python #gpt #rag #llama #finetuning

Разработка LLM моделей для обновления кода приложений на более высокие версии фреймворков или языков программирования

В этой статье я планирую исследовать, как можно использовать…

Хабр
Habr

Обыгрываем казино, с блэкджеком и стратегиями

В данной статье рассмотрим работу с библиотекой gymnasium для изучения машинного обучения с подкреплением. Реализуем агента, который использует метод машинного обучения q-learning для максимизации выигрыша в карточной игре blackjack. Сравним средний выигрыш за 100000 игр при различных реализациях игры blackjack.

habr.com/ru/articles/917924/

#rl #blackjack #ml #python #qlearning

Обыгрываем казино, с блэкджеком и стратегиями

В данной статье будет рассмотрена работа с библиотекой…

Хабр
Leshem Choshen

Training LLMs on many games can generalize and teaches
reasoning that holds in new environments.
However, weighting the games is complicated, so merging (my beloved fusing in the title) is used.
#ai #llm #rl #ml
alphaxiv.org/pdf/2505.16401

don-Rumata

Про воскресенье.
1. Гисметео обещало дождь (звонкой пеленой) весь день, а под конец ещё и гром (рапугал всех кошек), поэтому народу было прям немного. Асфальт мокрый, запах как после дождя, красота.
2. А ближе к берегу — солнце, сухая земля и поваленные деревья. 3 км, а какой контраст. На горе никого, но тёплая погода заставила ломануться на покосившийся причал ( #2946806 ). Любимый подъёмчик как всегда вжух. Забежал в шалаш, закинул немного ништяков.
3. Разложился на причале, "Endless Dream", DSotM и через по часа начало капать. Ну блин! Пакет на рюкзак, ветровку-дождевик на себя, новая порция чая в кружку, первый раз за сезон "Guitar Solo, No. 5" — о да, я берёг. Не успел дослушать, как капли закончились. Но атомосферы хватануть успел, дааа. 1:40 тоже вжух. Вода всё ещё ледяная, но ноги откисают отлично.
4. На скамейке дикого пляжа увидел группу индусов, остановился спросить знают ли они про Белую гору. Частично на русском, частично на английском, частично — языком жестов и танца^W^W показал где она находится и как добраться, вроде поняли. С нетерпением жду следующего воскресенья.
5. Сирень начала заканчиваться. Один из кустов на дороге Тысячи озёр полностью оборвали, уроды.

P.S. В #3074549 докинул чуть фоток. Сюда тоже ща докину. #лес #весна #RL

don-Rumata at Juick

#лес #RL #лето С @hardworm'ом, @paranoik'ом и 2-мя…

juick.com
don-Rumata

Про воскресенье.
1. Снова прохлада и моросящий дождь. Хотя народу достаточно много. Позёров нет, лол.
2. По берегу тоже ходят, но мало. На горе никого, кроме дождя. Трек обратного пути — "Never Again" с альбома "Phoenix".
3. На Скандинавии 3 пацана на великах спросили дорогу к горе, т.к. "телефон не показывает". На вопрос "gps или интернет не работает?" услышал: "мы не знаем, просто не работает". Объяснил как мог, надеюсь не заблудились. И да, "современные дети с детства сидят в гаджетах, поэтому разбираются в технике лучше" — ага, ага, верю. Почитайте тег "образование".
4. Решил найти шалаш, про который рассказывала в на днях знакомая из п.6 #2923597. Её муж в одно лицо всё построил, по фоткам — прям круто. Поплутал, но нашёл, да. Сделано афигенно. Затусил там. Даже стандартный плейлист не включал, час слушал дождь, птиц и пил чай. В коменты мож закину фото с кросовка.
5. А тут и дождь вроде прекратился. Сирень везде пахнет за несколько десятков метров до куста. Шикарно.
6. После Железного хребта решил пройти таки весь путь до Северного моста по берегу, но уже левому.
7. Железнодорожный мост теперь обнесён вышками, досмотрами и колючкой. А что случилось?
8. Ох, блин, я там последний раз был году, наверное в 21-м и пейзаж ОЧЕНЬ поменялся. Ещё бОльшее количество человейников, но, как ни странно — берег чистый, без бутылок и обёрток. Хотя кострищ — минимум по 3 на каждой полянке.
9. Таки прошёл по косе первый раз. Прикольное место и тоже чисто, удивительно. Обошёл по периметру Суворовский затон (аккум в плеере тут сел), вспомнил, почему в прошлые разы не получилось — была стройка и тупо было всё завалено строительным мусором и огромными лужами.
10. Посчитал по карте — вышло 28-29км. На +4 больше, чем обычно. Вроде немного, но чувствуется. В новом носке дырка, хехе. #лес #весна #RL

don-Rumata at Juick

#лес #осень #RL #Win Оххх. 4-й раз за неделю. 1. Хренова…

juick.com
Habr

Действительно ли у ИИ-агента есть внутренняя картина мира и представление о себе?

Представьте ИИ-агента в виртуальном мире: он не знает ни прошлого, ни будущего, ему доступен лишь крошечный фрагмент окружения. И все же, шаг за шагом, этот агент начинает «чувствовать» свое положение, выстраивать внутренние карты и даже формировать зачатки собственного «я». В этой статье вы узнаете, почему за кулисами обучения RL-агента скрывается удивительный процесс создания его внутренней картины мира.

habr.com/ru/articles/908666/

#ИИ #RL #сознание

Habr

Добро пожаловать в эру опыта: почему обучение с подкреплением изменит мир

ИИ подходит к новой стадии развития, которая обещает радикальные изменения во многих аспектах жизни и науки. В статье ниже мы рассмотрим ключевые изменения и технологии, которые сделают возможным наступление новой эры - эры опыта. Вы узнаете, почему нынешние подходы, основанные на человеческих данных, уже исчерпали себя, и как обучение на собственном опыте агентов откроет совершенно новые горизонты в развитии ИИ.

habr.com/ru/articles/907628/

#RL #ИИ #обучение_с_подкреплением #данные

Добро пожаловать в эру опыта: почему обучение с подкреплением изменит мир

Исследователи из Google DeepMind опубликовали интересную…

Хабр
don-Rumata

Про воскресенье.
1. Народу — не протолкнуться. Погода — весення весна. Сам не верил, что ровно неделю назад ( #3073744 ) шёл снег и 4 слоя одежды, один из которых свитер были в тему.
2. Да, в прошлый раз забыл написать, что к источнику сделали деревянную лестницу с металлическим каркасом. Мегахорошо. 2 стаканчика воды освежают.
3. Люди везде, много. На горе даже и не думал останвливаться — забито всё.
4. По Скандинавии (асфальтовой части) в полном экипе и одиночестве пронёсся позёр. Любимый подъёмчик — вжух.
5. Хоть причал-грибок и перестал существовать превратившись в огромную площадку, причал с навесом из фото #2946806 всё ещё стоит, там и открыл сезон ног в воде. Вода — ледяная, несколько минут и кожа горит. Зато освежает просто отлично. Стандартный плейлист плюс немного Dire Straits. 1,5 часа как и любимый подъёмчик — вжух.
6. Снова пересёкся с хозяином дома из п.6 #3056173. Снова вкусный шашлык, а ещё — холодненькая окрошечка на квасе и минералке! Потрындели немного за жизнь — он там с 2007-го живёт, а я там с 2009-го где-то гуляю, хыхы. Остаток пути был тяжёл (живот оттягивал вниз и тащил ща собой веки), но хорош.
7. Сирень везде цветёт и пахнет, но по количеству обломанных веток видно, что у нас дофига садоводов (они же для выращивания срывают, да, а не чтобы потом выкинуть?).

В коменты мож пару фоток закину, но это не точно. #лес #весна #RL

don-Rumata at Juick

#лес #весна #RL Практически только вернулся, итак. 1.…

juick.com