HealFrame은 심리 치료를 대체하나요?

아니요. 회복 단계에 맞춘 글쓰기를 돕는 도구일 뿐, 치료나 진단을 대체하지 않습니다. 그 선을 분명히 긋는 것이 이 글에서 말하는 설계 원칙의 일부입니다.

위기 감지 파이프라인은 어떻게 검증하나요?

평가 세트 기준으로 위기 신호 누락(false negative)에 0의 허용치를 두고 LLM-judge 평가 하니스로 반복 검증합니다. 이는 평가를 통과하기 위한 기준이지 실제 누락이 0이라는 보장은 아니며, 평가가 닿지 못하는 빈틈은 판단이 불확실할 때 위기로 간주하는 입력 단계의 fail-closed 원칙이 받칩니다.

개발

박사도 아닌 내가 멘탈헬스 앱을 만들어도 될까

이시형2026. 6. 10.7 min read

Read in English

2026년, 도서관에서 주디스 허먼의 『트라우마』(원제 Trauma and Recovery)를 빌려 읽었습니다. 원래 정신 상담과 분석 쪽에 관심이 많기도 했고, 이 모델이 낯설지 않게 읽히는 개인적인 이유도 있었습니다. 그 이야기는 여기까지만 하겠습니다.

책에서 가장 오래 남은 건 회복이 안전의 확보, 기억과 애도, 그리고 다시 연결되기라는 세 단계를 거친다는 구조였습니다. 읽다 보니 이 구조가 그대로 글쓰기 도구의 뼈대가 될 수 있겠다는 생각이 들었습니다. 지금 어느 단계에 있는지에 따라 써야 할 글이 다르다면, 단계에 맞는 프롬프트를 건네는 도구를 만들 수 있지 않을까. 그렇게 시작한 것이 HealFrame입니다.

가장 무거운 기능은 가장 안 보이는 기능

AI가 글쓰기를 안내하는 멘탈헬스 앱에서 기술적으로 가장 무거운 부분은 멋진 프롬프트가 아닙니다. 사용자가 쓴 글에서 위기 신호를 읽어내는 일입니다.

HealFrame은 Gemini로 입력 글을 GREEN/AMBER/RED 세 단계로 분류하는 위기 감지 파이프라인을 돌립니다. 설계에서 제일 신경 쓴 건 실패의 방향이었습니다. 입력 판정은 안전한 쪽으로 닫아뒀습니다(fail-closed). 분류가 애매하거나 시스템이 흔들리면 일단 위기로 봅니다. 반대로 출력은 열어뒀습니다(fail-open). 안전 장치가 오작동했다고 해서 사용자에게 가야 할 응답까지 막지는 않습니다. 위기를 놓치는 비용과 과잉 감지의 비용은 무게가 다르니까, 시스템이 실패하는 방향도 한쪽으로 기울어야 한다고 봤습니다.

검증도 같은 논리로 짰습니다. LLM-judge 평가 하니스를 만들어 파이프라인을 반복해서 돌리는데, 통과 기준은 하나입니다. 평가 세트 안에서 위기 신호 누락이 하나라도 나오면 실패로 칩니다. 다른 지표는 양보해도 이 기준만은 양보하지 않았습니다. 물론 이건 평가를 통과하기 위한 기준이지, 실제 세상에서 누락이 0이라고 증명된 건 아닙니다. LLM으로 LLM을 평가하는 이상 judge 자체가 틀릴 수 있다는 순환적인 한계도 있습니다. 그래서 평가가 닿지 못하는 빈틈을 마지막에 받치는 게 앞의 fail-closed 설계입니다. 불확실하면 위기로 간주하는 그 원칙이 마지막 층인 셈입니다.

그런데, 이게 정말 작동하는 걸까

여기까지는 엔지니어링 이야기고, 솔직한 이야기는 지금부터입니다.

위기 감지 파이프라인은 저만 만드는 게 아닙니다. 수많은 AI 회사들이 비슷한 것을 만들고 있고, 훨씬 많은 인력과 데이터로 만듭니다. 그런데도 현실에서는 여전히 많은 사람들이 자살을 시도하고, 실행합니다. 제 테스트 하니스가 전부 통과한다는 것과, 실제 어떤 사람의 가장 어두운 밤에 이 시스템이 작동한다는 것 사이에는 제가 증명할 수 없는 거리가 있습니다.

그리고 더 근본적인 질문이 있습니다. 저는 박사가 아닙니다. 임상가도 아닙니다. 책을 읽고, 관심이 있고, 경험이 있는 개발자일 뿐입니다. 사람의 마음을 건드리는 앱을 그런 사람이 만들어도 되는 걸까. 이 질문은 개발 내내 사라지지 않았고, 지금도 사라지지 않았습니다.

답 대신 지키는 선

저는 이 질문에 아직 답하지 못했습니다. 대신 만들면서 지키는 선을 몇 개 정했습니다.

첫째, 이 앱은 치료가 아니고, 치료라고 말하지 않습니다. 회복 단계에 맞춘 글쓰기를 돕는 도구, 거기까지입니다. 둘째, 가장 위험한 실패(위기 누락)에는 0의 허용치를 두고, 그것을 감과 선의가 아니라 평가 하니스로 강제합니다. 셋째, 모른다는 사실을 잊지 않습니다. 전문가가 아니라는 불안은 없애야 할 감정이 아니라, 이 도메인에서 계속 신중하게 만들게 해주는 안전장치에 가깝다고 생각하게 됐습니다.

만들어도 되는가. 여기엔 아직 확신이 없습니다. 그래도 확신 없이 조심하며 만드는 쪽이 이 영역에선 차라리 나을지도 모르겠다고, 요즘은 그렇게 생각합니다.

혹시 지금 견디기 힘든 시간을 보내고 있다면, 혼자 견디지 않아도 됩니다. 자살예방 상담전화 109, 정신건강 위기상담 1577-0199에서 24시간 전문 상담을 받을 수 있습니다.

#healframe #mental-health #ai-safety #gemini

발모벽을 고치려고 만든 앱, 아직 못 고친 이야기

2026. 6. 10.

제 홈서버는 노트북입니다

2026. 7. 17.

어기면 돈이 자선단체로 가는 금주 앱

2026. 6. 10.

가장 무거운 기능은 가장 안 보이는 기능

그런데, 이게 정말 작동하는 걸까

여기까지는 엔지니어링 이야기고, 솔직한 이야기는 지금부터입니다.

답 대신 지키는 선

저는 이 질문에 아직 답하지 못했습니다. 대신 만들면서 지키는 선을 몇 개 정했습니다.

혹시 지금 견디기 힘든 시간을 보내고 있다면, 혼자 견디지 않아도 됩니다. 자살예방 상담전화 109, 정신건강 위기상담 1577-0199에서 24시간 전문 상담을 받을 수 있습니다.

박사도 아닌 내가 멘탈헬스 앱을 만들어도 될까

가장 무거운 기능은 가장 안 보이는 기능

그런데, 이게 정말 작동하는 걸까

답 대신 지키는 선

관련 글

발모벽을 고치려고 만든 앱, 아직 못 고친 이야기

제 홈서버는 노트북입니다

어기면 돈이 자선단체로 가는 금주 앱

댓글

박사도 아닌 내가 멘탈헬스 앱을 만들어도 될까

가장 무거운 기능은 가장 안 보이는 기능

그런데, 이게 정말 작동하는 걸까

답 대신 지키는 선

관련 글

발모벽을 고치려고 만든 앱, 아직 못 고친 이야기

제 홈서버는 노트북입니다

어기면 돈이 자선단체로 가는 금주 앱

댓글