Языковые модели (ChatGPT+) и финансовые переменные.
Коллеги показали статью (май 2024), которая применяет ChatGTP4 Turbo к прогнозированию прибылей компаний США, а также доходностей акций. Что авторы сделали:
1) Аккуратно скрыли от модели информацию о компании и даже годе, стандартизировав отчётность;
2) Постарались понять, как именно рассуждает модель, и что является главными частями её прогнозов.
Результаты:
1) Направление изменения прибылей в следующем году ChatGPT4 делает лучше консенсуса аналитиков (ChatGPT3.5 заметно хуже) - условно 60% правильно против 53%. Более того, обыграны и ML-модели, и даже нейронная сеть;
2) Портфель акций, построенных на этих предсказаниях, имеет огромную альфу к трёхфакторной модели Фамы-Френча (12% в год!).
Мои вопросы:
1) Точно-точно нет "подглядывания в будущие данные"? Авторы стараются показать, что нет, но это неубедительно - неумение "предсказать" год или компанию не означают, что модель не "запомнила" финансовые связи из обучающих данных. Более того, качество прогнозов ухудшается с годами - это подозрительно;
2) Построение портфеля ну очень коварное (если вы посмотрите текст). Там столько ручных допиливаний, что непонятно, с чем сравнивать - объективно это не простой "пассивный портфель", который по сути получается в рамках модели Фамы-Френча. Поэтому я был бы осторожен в интерпретации.
Но в любом случае - новые интересные идеи, будем со студентами разбираться!
#AI #Portfolio #Earnings #MAFNES
Коллеги показали статью (май 2024), которая применяет ChatGTP4 Turbo к прогнозированию прибылей компаний США, а также доходностей акций. Что авторы сделали:
1) Аккуратно скрыли от модели информацию о компании и даже годе, стандартизировав отчётность;
2) Постарались понять, как именно рассуждает модель, и что является главными частями её прогнозов.
Результаты:
1) Направление изменения прибылей в следующем году ChatGPT4 делает лучше консенсуса аналитиков (ChatGPT3.5 заметно хуже) - условно 60% правильно против 53%. Более того, обыграны и ML-модели, и даже нейронная сеть;
2) Портфель акций, построенных на этих предсказаниях, имеет огромную альфу к трёхфакторной модели Фамы-Френча (12% в год!).
Мои вопросы:
1) Точно-точно нет "подглядывания в будущие данные"? Авторы стараются показать, что нет, но это неубедительно - неумение "предсказать" год или компанию не означают, что модель не "запомнила" финансовые связи из обучающих данных. Более того, качество прогнозов ухудшается с годами - это подозрительно;
2) Построение портфеля ну очень коварное (если вы посмотрите текст). Там столько ручных допиливаний, что непонятно, с чем сравнивать - объективно это не простой "пассивный портфель", который по сути получается в рамках модели Фамы-Френча. Поэтому я был бы осторожен в интерпретации.
Но в любом случае - новые интересные идеи, будем со студентами разбираться!
#AI #Portfolio #Earnings #MAFNES
Ssrn
Financial Statement Analysis with Large Language Models
We investigate whether large language models (LLMs) can successfully perform financial statement analysis in a way similar to a professional human analyst