1. 부동산 작가 김준영님의 전작 <결국엔 오르는 집값의 비밀>을 매우 인상 깊게 읽었다. 이 책의 가장 인상적인 점은 '지역별로 분석이 달라야한다'라는 명제를 주장했다는 것이다. 상식적으로 서울 및 수도권과 지방은 다르게 봐야된다는 단순한 이야기가 아니라 분석시 서울과 경기인천은 다르게 봐야되며, 수도권과 광역시, 광역시와 광역시, 광역시과 그 이하 중소도시 등 기준마다 부동산에 미치는 다양한 요소들(공급, 금리, 전세가율 등)의 가중치가 다르다는 것이었다. 그 외에도 어느 해의 입주물량이 많으니 그 지역은 하락압력을 받는다는 주장을 한 것이 아니라 최소한 3년 간의 누적입주물량과 평균 입주물량을 비교해서 해당 지역의 하락압력을 봐야된다고 주장한 것도 참신했다. 특히 2024년 당시 지방 부동산에 대한 전망이 매우 비관적이었음에도 불구하고 2-3년 뒤 부산, 울산, 대구의 반등 가능성을 제시한 점이 아직도 기억에 남는다.
2. 이렇게 현장 경험과 데이터를 적절하게 활용하는 김준영 작가님이 AI 모델을 이용해 더욱 부동산 흐름을 정밀하게 예측할 수 있다는 내용으로 책을 냈다고 해서 기대가 되었다. 또한 주로 금융투자 위주로 내용을 올리는 @Slav_insight 님이 부동산 서평을 모집하셔서 신청하게 됬다. 이번 신간은 전작의 분석을 기초로 한 단계 더 발전시켜서 'LGB-REAP 모델'이라는 AI 부동산 분석 모델을 소개한다. 작가는 오랜 현장 경험으로 대략적으로 어느 정도 상승과 흐름을 캐치하는 기준을 제시했지만 구체적으로 '전세가율 몇%부터 상승 신호로 볼 수 있다' '몇%를 넘기면 24개월 안에 상승 확률은 몇%이다' 등 정량적 기준을 제시하기는 어려웠다고 한다. 이 지점을 알고 싶어 40년간의 부동산 데이터를 AI 모델을 통해 학습시켰다.
3. 이 책의 장점은 크게 세 가지이다.
첫째, 부동산 시장에 중요 요소를 기준으로 판단할 수 있게 해 준다. 공급량(입주물량), 전세수급지수, 거래량, 매매전망지수, CSI(소비자동향지수), 전세가율이 그것이다. 이를 활용해 특정 지역의 상승 및 하락가능성을 점검하는 기준을 제시한다.
둘째, 그 동안 부동산을 공부하면서 막연하게 언급되던 명제들을 데이터로 검증했다는 점이다. 예를 들어 수도권의 매매가격 흐름은 입주물량 주기와 단순히게 연결되지 않는 경우가 많은데 지방은 상대적으로 입주물량과 가격 흐름의 상관관계가 높았다는 지점을 데이터를 통해 설명한다. 그 외에도 어떤 지역은 전세가율이 70%인데도 매매가격 흐름으로 전파되지 않고 서울은 전세가율 60%만 되도 바로 매매가격으로 전환되는지도 설명한다.
셋째, AI 모델 등 데이터의 한계를 솔직하게 인정한다는 점이다. 도시 단위에서는 상승 가능성을 판단할 수 있어도 개별 단지의 상승까지 보장하지는 못한다는 점이다. 특히 혐오시설이 단지 주변에 생기거나 학교가 없어지는 학군의 변화 등 현장에서만 파악할 수 있는 정보까지는 데이터가 말해주지 못한다. 또한 단순히 '수도권' '광역시' '중소도시' 이런식으로 분석결과를 나누지 않고 서울 수도권 인천 대구 부산 울산까지만 모델로 만들었으니 다른 지역은 별도의 분석이 필요하다고 언급한 것도 책의 신뢰도를 높였다.
4. 반면에 아쉬운 점들도 있었다.
첫째, 책이 대화체로 쓰여있어서 마치 자료 분석에 있어서 LLM 모델을 쓴 것처럼 오해할 수 있다는 점이다. LLM 모델을 쓴 책들이 대부분 LLM의 hallucination 문제나 분석의 재현성 결여 등의 이유로 신뢰도가 떨어지는 부분이 있다. 그런데 이 책은 그러한 LLM 모델이 아닌 머신러닝에 가까운 Light GBM을 사용했음에도 대화체로 구성해 마치 LLM 모델로 자료를 분석한 것 같아 구성이 아쉬웠다. 이 점은 좋은 내용의 신뢰도를 다소 떨어뜨릴 수 있는 부분이다.
둘째, Light GBM 외에 다른 모델로 분석해서 모델의 신뢰도를 높이는 부분이 없었다는 점이다. 책에서 소개한 Light GBM 모델이 강력한 모델이긴 하지만 다른 머신러닝 알고리즘으로도 같은 결론이 나오는지 궁금했다. 같은 디지션트리 계열인 XGBoost 라든가 아예 다른 로지스틱 회귀 분석 등 다른 모델을 적용해서 같은 결론이 나왔다면 분석 모델에 더욱 신뢰도를 줄 수 있을 것 같다.
5. 개인적으로 저자가 도출한 핵심 결론이 먼제 제시된 뒤 모델의 완결성을 검증하고 한계점을 지적하고 독자에게 다른 지역을 분석하도록 유도하는 서술이 좀 더 좋은 책을 만들었을 것 같다. 하지만 그런 아쉬움에도 불구하고 일독할 가치가 충분히 있는 책이다. 홈페이지를 통해 사용자가 직접 해당 지역에 대해서 상승 하락 신호를 확인할 수 있는지 공개해 참조할 수 있고 모델을 구축한 자료들의 출처를 공개해 독자가 판단할 수 있도록 했다. 물론 98년도 IMF 금융위기나 21년도 금리인상처럼 외부변수에서 취약할 수 있겠으나 복잡한 부동산 시장을 지역별 특성에 맞춰 다섯 가지 신호로 정리하고, 이를 실제 투자 판단에 활용할 수 있는 형태로 제시했다는 점은 충분히 의미 있는 시도라고 생각한다. 모든 투자 판단을 대신해주는 만능 도구라고 보기는 어렵지만, 적어도 시장을 보다 체계적으로 바라볼 수 있는 하나의 틀을 제시했다는 점에서 읽어볼 가치가 있는 책이라고 생각한다. 특히 나처럼 전작을 재미있게 읽었던 독자라면, 그리고 부동산 시장을 조금 더 데이터 중심으로 바라보고 싶은 사람이라면 읽어볼 만한 가치가 있다.
이 두 시간 속에서 나를 지켜준 것은 데이터였다. 모두가 떠날 때 데이터는 ‘아직 이르다‘고 말했고, 모두가 몰려들 때는 ‘조심하라‘고 말했다. 시장은 내 편도, 적도 아니었다. 다만 늘 먼저 신호를 보내고 있었을 뿐이다. - P268