게시물 목록

Thursday, December 1, 2022

중력현상의 시뮬레이터로서의 양자컴퓨터: AdS-CFT 대응의 이용

양자컴퓨터로 웜홀을 구현했다는 따끈따끈한 네이쳐 논문이 기사로 나왔다 (네이쳐 논문 링크, 국문기사(뉴시스) 하이퍼링크, 영문기사(quanta magazine) 하이퍼링크). 매우 네이쳐스러운 논문이라는 생각이 든다. 이런 주제들은 나도 교양수준으로만 알고 수식들은 거의 모르는데, 대략 이해한 내용을 써본다. '어려운 저차원 양자다체계 현상'과, '쉬운 고차원 중력현상'의 대응이라는 틀을 기억하면 읽기에 용이하다.


먼저 '양자전송'은 양자얽힘 현상에 의해 정보를 원격 전송하는 것으로, 양자암호(양자기반암호화, 양자내성암호)와 함께 양자통신이라는 큰 카테고리를 이루고 있다. 양자암호가 각국의 정부 및 산업계에서 상용화 관련 논의가 될정도인 것과 달리, 양자전송은 아직은 실험실 내의 기초과학 연구에 머무르고있다.


양자전송은 국소성 (대충 말해서, 물리적 현상은 공간상에서 정보가 잇따라 전달되면서 나타나며, 한번에 여기서 저기로 점프하진 않는다는 믿음) 을 위배한다. 이것이 직관적으로는 매우 이상하므로 해명이 필요한 역설이라고까지 생각되기도 했는데, 우리 학부 김석 교수님 말씀에 따르면 이상하긴 해도 국소성이 깨지는 게 그냥 사실이라고 한다. 그것이 양자세계의 비직관성이며 양자전송의 놀라운 점이다.


양자전송을 하려면 양자상태들 사이의 얽힘(entanglement)을 유지해야 하는데 이는 무척 어려운 일이다. 그런데, 양자컴퓨터는 여러 양자상태의 얽힌 상태를 유지하며 제어해서 한꺼번에 커다란 계산을 해내는 장치이므로 얽힘을 유지하는 노하우가 많이 들어가있다. 그렇기때문에 양자컴퓨터는 얽힘 실험을 하기에 최적의 시스템이다. 이번 논문에서도 9 큐비트짜리 양자컴퓨터 위에서 양자얽힘을 활용해서 실험을 했다.


이 논문도 기본적으로 양자전송을 실험적으로 구현한 여러 논문 중에 하나이다. 그런데 이 논문의 재밌는 점은 바로 홀로그래피 원리, 더 정확히는 AdS-CFT correspondence (반 드 지터 공간 - 등각 장론 대응성) 를 이용해서, 흔한(?) 양자통신을 넘어서 훨씬 멋있는 해석을 했다는 점이다.


AdS-CFT 대응성이란 홀로그래피 원리의 일종이다. 간단히 말해서 (1) 높은 차원 공간에서 정의되며 상호작용의 크기가 약한 이론 (주로 양자 중력이론의 후보인 끈 이론) 과, (2) 그 고차원공간의 '경계면'인 낮은차원공간에서 상호작용의 크기가 강한 이론 (주로 응집물질 계에 대한 양자 장론) 이 형식적으로 동일하다는 것이다! 고차원공간의 정보가 그 경계면인 저차원 공간에 오롯이 담겨있다는 점에서 홀로그램을 연상시켜서 그렇게 부른다.


이 대응을 이용하면, 우리가 사는 차원에서 강하게 상호작용하는 다체계 (쉽게말해 양자컴퓨터 내지는 고체 및 반도체 같은 응집물질들) 의 풀기 어려운 문제를, 고차원에서의 끈 이론의 풀기 쉬운 문제로 대신해서 쉽게 풀 수 있다. 더 멋있게 말하면, 물질 속의 집단현상 문제를 우주 속 중력 문제로 대신해서 풀 수 있다. 이것이 홀로그래피의 강력함이다.


그런데 이 논문에서는 위와는 정반대 방향의 접근을 한다. 둘 사이에 그런 대응이 있다면, 실험으로 만들기 힘든 웜홀 같은 양자중력현상을, 실험으로 어느정도 구현가능한 저차원의 다체계현상으로 대신해서 실험할 수 있다는 재밌는 접근이다.


먼저 우주에 있(을 수 있다고 믿어지)는 웜홀에서 양자전송이 가능한것처럼, 실험실 속의 양자 다체계에서도 양자전송이 가능하며 이는 이미 꾸준히 실험으로 확인이 되고있다. 그런데 이 두 가지는 양자정보의 전송이라는 점에서 통하지만 기본적으로는 별개의 물리현상이다. 전자는 양자중력 현상이고 후자는 중력과 상관이 없다.


이 논문에서는 양자컴퓨터의 설비로 sparsified SYK 모델이라는 양자다체계를 구현해서 실제로 양자전송을 했다. 그런데 이 모델은 흥미롭게도 AdS-CFT 대응에 의해, 웜홀에 대한 중력이론과 같은 방정식으로 기술이 된다. 이렇게 웜홀의 양자전송과 양자다체계에서의 양자전송이 (형식적으로) 연결되게된다.


따라서 양자컴퓨터를 양자중력현상에 대한 적절한 시뮬레이터로 쓸수 있다는 개념증명을 했다고 보면 될 것 같다. 실제로 웜홀에서 있어야 하는 여러가지 성질들이, 이 논문에서 연구한 시스템에서의 양자전송에서도 나타났다고 한다. 다만 이 (가상의) 웜홀은 아주아주 짧은 거리 사이의 웜홀이라고 한다.


마지막 질문은, 어떤 양자다체계랑 웜홀이 같은 이론으로 기술이 된다고 해서, 그 양자다체계 실험장치 속에 정말로 웜홀이 생긴 것인가? 이는 굳이 따지자면 따질 수 있는 과학철학적 문제인데, 보통은 상식적으로는 'No'라고 답할 것 같다. 실제로 논문에서도 웜홀을 실제로 만들었다 라고 무리하게 주장하기다는, 실험실 속에서 양자중력을 간접적으로 연구할 수 있는 방법을 제시했다고 말하고 있다.


쭉 쓰고 나서 생각해 봐도 정말로 네이쳐스러운 논문인것 같다.


Facebook에서 이 글 보기: 링크

Wednesday, November 30, 2022

계산기로서의 비선형동역학계를 연구하는 Herbert Jaeger 교수님

Herbert Jaeger 교수님은 대학원 입학 초기에 조사해 보았던 분이다. 그런데 이 분이 하시는 일이 내 최근 관심사와 비슷해서 요새 다시 생각이 난다. Reservoir computing 패러다임의 일종인 ESN (echo state network) 를 만든 분인데, 그것을 포함하여 수많은 비선형성이 있는 신경망기반 기계학습에서 블랙박스의 beyond에 모종의 이해가능하고 일관성있는 로직을 수립하려는 conceptor라는 일도 하셨어서, 이게 재밌어서 찾아봤었다.


요새 이분에 대해 다시 관심이 생긴 것은, Facebook 및 블로그에도 몇번 썼듯이 최근에 '의미 엔지니어링' (내가 임의로 정한 용어) 그리고 아날로그 컴퓨팅에 꽤 관심이 생겼기 때문이다. 다만 이 분의 백그라운드 및 방법론은 비선형동역학 및 약간의 통계학 기반이고, 아쉽게도 내 전공인 통계물리 이론이랑은 큰 관련은 없어보이기는 한다.


아날로그 컴퓨팅 혹은 unconventional computing 이라고 하면 뭔가 순수 학계에서 소소하게 하는 일이라는 이미지가 있다. 그런 데서는 정말 온갖 종류의 정보처리 시스템 및 비선형 시스템을 제어가능한 계산기로 엔지니어링하기 위한 기초원리와 building block을 확립하고자 한다 (아래 그림 참고. 그림 상단에 출처.).

문구: 'OP Publishing Neuromorph. Comput. Eng. (2021) 012002 Topical Review digital unconventional Mumaral neuromorphic nw Figure1. The scopes of digital, neuromorphic and UC na napkin drawing. DC exploits only binary switching. NC furthermore standardly uses real-valued functions stochasticity, but occasionally more. UCis open o wide spectrum of physical effects which today are modeled with an equally wide range omasm'의 이미지일 수 있음

내가 공부하고있는 능동물질(active matter)의 경우에도 정보처리 기계로 보는 관점이 점점 등장하고 있으니, 능히 그중 하나가 될수 있을 것이다. 반면에, '뉴로모픽'이라고 하면 직접적인 칩설계 및 생산 쪽과도 같이 일할것 같은 느낌으로, 좀더 인더스트리와 연계가 잘된 느낌이 난다. 이 두 용어는 교집합이 없지 않지만 기본적으로 매우 달라 보이는데, 현재 나는 그 landscape에 대해 잘 이해하고 있는 상태는 아니다.


Jaeger의 MINDS 랩에서는 아날로그컴퓨팅을 어렵게 하는 여러 가지 장벽들을 살펴보는 문제설정을 해서 논문으로 풀어나가고 있다. 이러한 학술적 관심사를 저전력 뉴로모픽 컴퓨팅에서의 실질적인 문제해결으로까지 이어가고자 하는 듯하다. 논문이 자주 나오는 편은 아니다. 비슷한 일을 하는 연구실들과 회사들도 좀더 찾아보고 알아두려고 한다.


Herbert Jaeger 구글 스콜라 페이지: 링크

Herbert Jaeber의 MINDS 랩 홈페이지: 링크


Facebook에서 이 글 보기: 링크

Saturday, November 26, 2022

학술행사에서 제공하는 프로그램을 적극 활용하자

이번에 대전에서도, 포항에서도 학술행사에 참여하면서 느낀 게 있다. 여태까지는 학회 와서 한편으로는 너무 수동적인 태도를 가졌고, 한편으로는 너무 능동적으로(?) 개인플레이를 했구나 싶은 것.


지금까지는 오프라인 학술행사에 가면 주로 늘 뵙는 분들만을 계속 뵈었던데다, 연구 진전이 빠르지 않다보니 포스터발표도 어차피 큰 틀에서는 같은주제로 조금씩 발전시켜서 했었다. 그렇다보니 학회의 주인공은 교수님들이고, 포스터발표는 뭐 하면 하고 아니면 안하는것 정도의 생각을 갖고 있었던 듯하다.


그런데 요즘의 학술행사들에는 코로나시국 이후여서 그런지 처음 뵙는 외국대학 교수님들과 학생들도 많고, 규모가 커져서 우리 세부분야 말고 다른 새로운 분야도 늘 접하게 된다 (이건 코로나 이후 내 첫 오프라인 행사였던 작년 경주에서도 그러긴 했다). 대전의 경우 포스터발표의 prize도 유명 퍼블리셔인 AIP의 지원을 받아서 주어지기도 했고... 아무튼 뭔가 글로벌한 행사라는 느낌이 점점 실질적으로 체감되고 있다.


이렇게 되니까 평소에 논문에서만 봤던 교수님들이 계실 때 말씀 한마디라도 괜히 걸어보는 것이 좋은 경험이 된다. 만약 그럴때에 내가 포스터발표를 했다면, 일일이 자기소개 하지 않아도 아 자네가 포스터 뭐뭐 발표했던 학생이구나~ 하고 대화의 물꼬를 좀더 쉽게 만들어 나갈 수 있다는 느낌이 들었다. 회기랑 대전에서 포스터발표 안 한 뒤에 이런 걸 느끼고서 포스터발표를 급하게 준비해서, 포항에서는 잘 진행을 했다.


포스터발표 외에도... 지금까지는 학술행사에서 제공하는 여러가지 프로그램 (식사, Excursion (스케쥴 중간쯤에 있는 반나절 정도의 나들이), 주최기관 탐방 등) 을 그리 열심히 이용하지 않고, 여건이 되면 바깥으로 나가서 혼자서 개인플레이 하거나, 혹은 랩사람들이랑 다니는 경향이 있었던것 같다.


그런데 생각해보면 교수님께서 참여 기회를 주신것이고 주최기관 직원선생님들도 많은 재정적, 행정적 서포트를 해주신 건데, 가급적 학술행사에서 제공하는 프로그램을 적극적으로 이용하는게 맞겠다는 생각이 들었다. 그런걸 모두 감안해서 계획과 예산이 짜인 것일 테니까 말이다.


계속 개인플레이를 하게되는 이유는 일단은 사실 학회장의 식사가 성에 안차는 경우가 많고 (...) 이왕 관악 바깥으로 나온거 뭔가 해당지역에 가볼만한 데를 가보고 싶다는 생각이 있어서 그런 것 같다. 더 중요한 이유는 내가 익숙한 사람들끼리, 혹은 처음 보는 사람이라도 일대일로 대화하는 건 즐거워하지만, 다대 다로 모이는 자리는 좋아하지 않는 편이어서 그렇다.


암튼 앞으로는 포스터발표는 거의 필수라고 생각하고, 밥도 되도록 갠플하지 말고 학회에서 안내하는 프로그램대로 사람들이랑 얘기하면서 먹는게 좋겠다 싶었음.


Facebook에서 이 글 보기: 링크

Tuesday, November 15, 2022

[강연정보] 학제적 분야에서 경험적 정당화의 형식 (사회학과 손윤규 교수)

사회학과 손윤규 교수님께서 "학제적 분야에서 경험적 정당화의 형식"이라는 주제로 강연을 하신다. 자연과학과 사회과학의 방법론을 비교하고 교류를 모색한다는 점에서 재미있는 세미나일 것 같고, 메타적인 합리성을 추구하는 작업으로 의미가 있어보인다. 정작 나는 이번에도 저 날에 출장 중일 예정이라 못 간다. 연구소 측에 연락해서 발제문이나 발표자료를 주실 수 있을지라도 한번 여쭤봐야겠다.


마침 다루는 사례도 우리 통계물리분야와 뗄래야 뗄 수 없는 네트워크과학 쪽이라고 하니 더 관심이 간다. 실제로 우리분야에서 네트워크 이론 연구하시는 분들이 사회과학적 주제에 대해 결론을 도출할 때 그것을 어떻게 수용해야 하며, 사회과학에서의 네트워크 분석과는 어떻게 다를지, 그 각각이 얼마나 엄밀한 것일지 등이 늘 궁금하기도 했다.


연사이신 손윤규 교수님은 사회학과에서 네트워크분석을 하는 분인데, 찾아보니 실제로 복잡계 네트워크이론 학자 분들과 공동연구를 하셨기도 하다 (추가: 나중에 알게 된 바로는 아예 물리학 백그라운드를 가지신 분이다). 학제적 연구를 실제로 직접 하시면서 느낀 점을 바탕으로, 이렇게 메타적(?)인 주제를 다루면서도 고유의 내용이 있는 세미나가 기획된것이 아닐까 한다.

Facebook에서 이 글 보기: 링크

____________________
2022년 제6회 월례세미나(Frontiers in Social Science)
“학제적 분야에서 경험적 정당화의 형식”
학제적 패러다임의 등장과 함께, 서로의 영역을 거의 침범하지 않았던 채로 형성된 자연과학 전통 하의 경험적 정당화 방식과 사회과학 경험 연구에서 표준적인 정당화 절차로 여겨졌던 방법론은 공존, 혼재, 혹은 충돌하게 되었다. 이 발표에서는 사회과학과 자연과학에서의 경험 자료에 대한 인과적 설명 및 이론 검정 방식이 확률적 메커니즘에 대한 가설 연역적 논증을 구성하는 데에 있어서 근본적인 차이를 보임을 밝히고, 네트워크 과학에서의 사례를 제시한다. 이를 바탕으로, 학제적 분야에서 이질적인 분과학의 전통을 따르는 연구들이 고립된 지식 생산을 넘어서 상호 교류할 가능성에 대해서 논의한다.
- 발표: 사회학과 손윤규 교수
- 사회: 정치외교학부 안도경 교수
- 일시: 2022년 11월 23일(수) 13:00-14:30
- 참여방법: 2022년 2학기 월례세미나는 오프라인에서 진행됩니다.
- 구글폼을 통해 오프라인 참석 신청 부탁드립니다.
- 12시 45분부터 샌드위치가 제공될 예정입니다.
- 장소: 16동 M111호 사회과학연구원 세미나실

꽃, 문구: '사회과학연구원 월례세미나 Frontiers in Social Science 2022년 2학기 제6회 학제적 분야에서 경험적 정당화의 형식 11월 23일 수요일 13:00~14:30 발표 손윤규 교수 (사회 학과) 사회 안도경 교수 (정치외교학부) 참여방법 2022년 2학기 월례세미나는 오프라인에서 진행됩니다. ※ 2시 45분부터 샌드위치가 제공됩니다. 장소 16동 M111호 사회과학연구원 세미나실 ※사회대 건물동 1층에 위치합니다. 문의 css@sr css@snu.ac.kr 02-880-5475 서울대학교 회과학연구원 Social'의 이미지일 수 있음

Saturday, November 12, 2022

[강연정보] Stochastic gradient descent as anomalous diffusion (비정상 확산으로서의 확률적 경사하강법)

U Simsekli 교수님의 초청강연 정보를 뒤늦게 알게 되었다. Simsekli는 딥러닝에 쓰이는 확률적 경사 하강법(stochastic gradient descent, SGD)를 heavy-tail을 갖는 확률과정으로 취급하고 (혹은 그럴 수 있다는 것을 정당화하고), 이것을 바탕으로 SGD의 일반화 성능을 설명하는 연구를 하는 분이다. 통계물리학 분야에서는 그러한 확률과정을, 가장 잘 연구된 브라운 운동(Brownian motion)과는 다르다는 의미에서 anomalous diffusion (비정상 확산) 이라고 부른다.

이분 논문을 직접 쭉 읽어본적은 없지만 ML theory 쪽으로 검색을 하다보면 이름이 종종 보이고, 이런저런 세미나에서도 이분 논문 소개를 여러차례 들었었다.

SGD가 어떤종류의 확률과정이며 어떻게 좋은 minima를 찾아가는지에 대한 기초연구는 기본적으로 응용수학의 영역이지만, 비평형 통계물리 백그라운드를 가진 연구자들도 실제적인 확률적 동역학계에 대해 축적된 지식이 많다 보니 escape problem 등의 관점에서 조금씩 기여를 한다.


이러한 주제는 교수님께서 종종 추천해 주시고, 나로서도 비록 교양 수준이지만 관심이 많이 가는지라 세미나에서 몇번 발표해 봤던 주제이기도 하다. 강연 정보를 진작 알았다면 쭉 들었을텐데 아쉽고 마지막 회차라도 꼭 들어봐야겠다. 


문구: '서울대학교 수리과학부 10-10 Project 석학 초청 집중 강연 Optimization and generalization theory of SGD in deep learning 연사 Umut Şimşekli École Normale Supérieure de Paris SIERRA Team, INRIA Paris 일시 수요일 15:00-17:00 장소 ZOOM 937 905-8748 11.02 Introduction to statistical learning theory, neural networks, and SGD 11.09 The "wide minima phenomenon", heavy-tailed behavior of SGD, first exit times Generalization bounds for heavy-tailed SGD 11.23 Negative aspects of heavy tails: mode shifts and debiasing 주최및후원 주최 SNU 10-10 Project 서울대학교 산업수학센터 IMDARC 문의 류경석 (ernestryu@snu.ac.kr) @snu.ac.kr) 서인석 insuk.seo@snu.ac.kr)'의 이미지일 수 있음

Friday, November 11, 2022

지도교수님의 웹진 기고문 소개

[크로스로드] 능동물질: 스스로 움직이는 입자들의 통계물리학 (링크)

몇 달 전이지만 제 지도교수님께서 능동물질(active matter)에 대해 아태이론물리센터 <크로스로드>에 기고하신 아티클입니다. 물리학회 웹진 <물리학과 첨단기술>에도 게재되어 있습니다.

평형으로부터 떨어진 채로 여러 재미난 집단 현상을 보이는 능동물질에 대한 설명이 잘 되어 있으니 관심 있으신 분들은 읽어 보시길 권합니다. 제 연구주제 또한 이러한 능동물질이 소모하는 에너지적 비용을 계산하는 일과 관련이 있습니다.

저도 언젠가 교수님처럼 훌륭한 연구자로 성장해서 기고의 기회를 얻는것을 상상해봅니다.

Facebook에서 이 글 보기: 링크

Saturday, November 5, 2022

ICTP-KIAS School on Statistical Physics for Life Sciences 참여 후기

이번 ICTP-KIAS 스쿨(행사 홈페이지: 링크)에서 개인적으로 가장 기대한 연사는 일본의 도쿄대학에서 정보이론과 열·통계역학을 통합적으로 다루는 연구를 하시는 Takahiro Sagawa 교수님이었다. 확률열역학 이론 쪽에서 논문 서칭을 하다보면 이분이 저술한 논문을 상당히 자주 마주치게되고 또한 읽어보게된다. 그러다보니 젊은 나이에 이미 우리 분야에서 큰 상을 받으셨다고 하며, 아직도 사실 굉장히 젊어보이신다. 한국에서 유명한 김상욱 교수님과도 예전에 양자 정보열역학 쪽으로 공동연구를 한 바 있다. 발표도 매우 재밌었고, 후술하겠지만 질문도 여러차례 할 기회가 있어서 인상깊은 시간이었다.

사가와 교수님은 아마 강의 당일인 목요일부터만 참석하신 것 같고, 사실은 화요일 저녁 banquet 때 우연히 그분의 제자들, 그러니까 도쿄대 대학원생들과 함께 앉게 돼서 이야기를 나눴는데 꽤나 재밌었다. 한국에 짧지 않게 오는 건데 여행계획이 있냐는 질문에, 사격장에 가보고 싶다고 꼽은 게 특이했다. 일본에서는 사격장이 없는건 아니지만, 그런 데 가더라도 라이센스가 있는 경우에만 쏴볼 수 있다고 한다. 그래서 한국에 갔을때 해 볼 만한 체험으로 실탄사격이 나름 유명한 모양이다. 한국인들에게도 잘 알려진 남대문사격장을 알려줬는데 역시나 이미 알고있는 눈치였다.

그리고 이번에 오진 않았지만 연구실 학생 중에 한 명은 Yobinori 라는 과학 유튜버를 하고있다고 한다 (Youtube 채널: 링크). 구독자가 90만명 정도니까 아마 일본에서 꽤 이름있는 과학 채널일 듯한데, 일본어로만 제작하다보니 우리는 잘 몰랐었다. 한편 이들도 김상욱 교수님 이름을 안다고 해서, 한국에서 연예인들에게 과학을 설명해주는 등 텔레비젼 스타가 되셨다고 말해주었더니 매우 흥미로워했다.

또한 일본에서 일하는 지인들이 일본 음식 사진을 많이 보내주어서 나도 가고싶고 (초등학교때 한번 부모님 손잡고 갔었고... 이번 8월에 오랜만에 갈 줄 알았는데 코로나로 진작에 취소돼서 못갔다), 한국사람들이 일본 여행을 좋아한다 등등 얘기도 했다. 그렇게 말하니 만약 면요리를 좋아하면 와서 라멘을 꼭 먹어라, 근데 호불호가 있는 두가지 서로 다른 스타일이 있으니 잘 알아보고 가야한다는 답이 돌아왔다.

사가와교수님 발표 얘기를 더 해보자면... 정보 이론과 열역학은 엔트로피라는 양을 중심으로 큰 교집합이 있지만, 또한 각자 다른 픽쳐와 관심사를 가지고있다. 또한 그것들 각각이 기계학습에 대한 이론적 이해에 나름의 방식으로 기여한다. 이번 스쿨의 취지 자체가 (특히 생체시스템에서) 그 모든 것들을 통합적으로 조망 및 이해하는 것인만큼, 정보열역학 분야의 전문가인 사가와 교수의 초청은 스쿨의 목적에 이보다 더 부합할 연사가 있을까 싶을 정도로 매우 적합했다고 보이며 내 흥미에도 맞았다. 여담이지만 사가와 교수님 본인도 이번 발표일정이 코로나 이후 첫 해외여행이라 감회가 남다르다는 식으로 말씀하셨다.

사실 나는 맥스웰의 악마와 정보 엔진 등에 대해 아직까지는 약간 개념적인 사고실험으로만, 혹은 다소 인위적이고 기초적인 실험셋으로만 존재하는 것인줄로 생각해서 개인적으로 큰 흥미를 느끼진 못했었다. 그런데 이번 발표에서는 나로서는 다소 고리타분하게 느껴지는 그런 거시적이고 도식적인 예시에서 출발은 했지만, 궁극적으로는 내게 익숙한 요동치는 small system에 대한 비평형 통계물리학이랑 잘 통합된 픽쳐로 소개해 주시니까 대단히 재밌었다.

그런 픽쳐에서 정보이론적 양들이 에너지적인 양들과 동등하게 다뤄지고, 일반화된 열역학 제2법칙 형태로 깔끔하게 써지는것도 마음에 들었다. 사실 아무리 맥스웰의 악마라도 2법칙을 만족하게끔 통합적으로 써지는건 당연히 그래야 하며 또 그렇게 될 수밖에 없는데, 미시적 비평형계에 대해 내가 파편적으로 찾아봤던 연구들에서는 그런걸 우아하지 못하고 덕지덕지(?) 형식화한 느낌이 있었다. 그런데 그걸 사가와교수님이 최대한 깔끔하게 정리해서 강의 해주신것 같다.

또한 맥스웰의 악마 같은 게 오직 이론물리에서만 관심을 갖는 특이한 상황같은 거라고 잘못 생각할수도 있으나, 사실은 확률열역학의 도구를 빌려 동역학적(dynamical)으로 형식화한다면 생체시스템의 정보이론적, 열역학적 view에도 무척 자연스럽고 풍부하게 적용될수 있다는 내 직관이 확인되는 것 같아서 마음에 들었다. 동역학적 개념으로서의 정보를 다루는 방법으로는 대표적으로 information flow와 transfer entropy가 있는데, 나는 이 두 픽쳐가 commensurable하지 않다고 생각했고, 그 둘중 어느쪽으로 합의가 안되고 공존하는 상황이 예쁘지 않고 불만족스럽다고만 생각했다. 그런데 사실 이 둘은 부등식으로 명확히 관계지어질 수 있다는걸 이번에 알게 되기도 했다.

사가와교수님이 연구를 소개하면서 마지막으로 들어주신 예시는 정보처리 기계로서의 칼만필터(Kalman filter)를 정보열역학적으로 보고 효율을 계산한 연구였다. 정보열역학적 효율개념이, 통계학에서 말하는 충분성의 개념 (sufficient statistics)과 나름대로 자연스럽게 연결이 된다. 내가 학부때 한동안 공부했던 칼만필터 등의 제어이론(control theory)과, 대학원에서 전공하고있는 비평형 통계물리학은 똑같이 확률미분방정식(SDE, 혹은 물리학자들의 용어로는 Langevin 방정식)을 사용한다. 그래서 이쪽으로 비교적 수월하게 넘어올수 있었지만 여전히 그 둘은 분명히 다르다고 생각한다. 그런데 이런 식으로 또 학술적으로 의미있게 관련이 지어지기는 하는구나 싶었다 (그래도 통계물리는 결국 물리고, 제어이론, 통계학, 기하학 등 다른 포말리즘과의 관련성 그 자체에 지나치게 매료되는건 조심해야되긴 한다. 당장 나부터도 그런 포말리즘적 연결을 과도하게 좋아하는 편인데 비해, 학술적으로 새로운 결과를 준다거나 하는건 별로 없는듯해서 일부러 경계하는 중이다).

워낙 기대하던 연사분이다 보니, 그다지 날카로운 질문은 아니지만 뭐라도 질문하고 싶어서 강의 도중, 그리고 강의 직후에 세네 개 정도의 기초적인 질문을 하기도 했다. 첫번째 질문은 핀트가 잘 전달이 안되었는지 만족스러운 답변을 듣지는 못했고, 나머지 답변에서는 매우 명쾌한 답을 들을 수 있었다. 그 내용은 다음과 같다.

(1) 어떤 물리적 시스템이 주어져있을 때 그것을 N개 state로 나눠서 보면 엔트로피의 상한이 log N이지만, 2N개 state로 나눠서 보면 엔트로피의 상한이 log 2N이다. 이는 물리계에 대해 생각만 다르게 했을뿐인데(think different) 물리량 자체가 달라진다는(physics does change) 인상을 준다. 이를 어떻게 이해할수 있는가?

(2) Autonomous한 정보처리 시스템을 소개할때 셋업으로 (i) continuous time을 생각하겠다 (ii) 계 외부로부터의 feedback control이 없는 계를 생각하겠다 이렇게 두가지를 제시했는데, 필연적으로 연결이 되는것인가 아니면 서로 독립적인 조건인가?

-> 문제 정의상으로는 서로 독립적인데, 실질적으로는 closely related되어 있다. 생체 기계들이나 인공 나노기계 등에 적용하기 위해 이러한 셋업을 한것이다.

(3) 세포 같은 걸 생각하면 아무리 autonomous하더라도, 피드백을 주는 demon이 계 안에 있는것일 뿐이지, 에너지 투입은 있어야 되는 것 같다. 내 생각처럼 에너지 주입이 정보처리를 drive하는 것이 맞나?

-> 그렇다. 에너지 주입이 정보처리로 연결되는 과정을 직접 모델링할수도 있다.

(4) 정보에 대한 dynamic한 formulation은 매우 재미있어 보이기는 한데, 커다란 summation을 포함하므로 scalable하지 않은것 같다. 정보이론적 양들을 효율적으로 계산할수 있는 방법 같은게 있는가?

-> 나는 수치적인 쪽의 expert는 아니지만, 그런 수치적인 방법들이 존재한다는것은 말할 수 있다. 하지만 기본적으로 헤비한 계산들인건 맞다.

이런식으로 질의응답을 했고... 특히 사가와 그룹은 최근에는 원론적인(?) 정보열역학뿐만 아니라 생체 기계들에의 보다 적극적인 응용도 하고있는 듯하니, 능동물질 쪽 연구자로서 앞으로 정보열역학 쪽과 엮일 일이 늘어나지 않을까 기대해본다. 특히 나 같은 경우 물리계에서 임의로 정의한 효율척도가 아니라 실제로 소모한 에너지와 관련된 thermodynamic cost를 수립하는 작업에 관심이 있다보니, 능동물질뿐 아니라 전통적인 정보처리시스템(계산기)에 대해서까지 이런 흥미를 확장한다면 정보열역학과 접점을 찾는것도 금방일듯하다.

사가와뿐만 아니라 스쿨 전체에 대해 총평해보자면... 스쿨이라는 이름에 부합하게 education에 초점이 맞춰진 무척 재밌는 학술행사였다. 5일 동안 총 네 분의 교수님이 템포를 조절해가며 기본부터 차근차근 가르쳐주셨고, 최신 연구도 조금씩 소개해주셨다.

내 본진(?)이라고 할수 있는 확률열역학을 다뤄주신 이재성 교수님 강의는, 익숙한 토픽들을 좀더 디테일하게 복습하는 느낌으로 들었다. 최근의 연구들을 보면 굉장히 근본적이어(?) 보이는 열역학적 부등식들도, 사실은 수리통계학에서 나오는 고등학교 수학스러운 부등식들을 tricky하게 열심히 적용해서 얻어지는 경우가 많은듯하다. 그런 tricky한 것들을 꿰뚫는 좀더 간명한 수학적 원리가 존재하지 않을까 생각을 해본다. (아마 이건 분명히 존재하지만 내가 못보고 있는듯하다)

이론물리학의 초일류 테크를 타다가 생물쪽으로 틀어서 미 국립보건원에 계시는 Vipul Periwal 교수님도 이번에 강의를 하셨다. 통계물리를 데이터사이언스에 적용할수 있게끔 analogy를 쭉 설명해주시고, large deviation theory를 차근차근 설명해주셨다. 이 역시 우리 연구실 스터디에서 다뤘던 부분이라 복습 느낌으로 잘 따라갈수 있었다. 한가지 새로웠던 것은 inverse Sanov theorem이었다. 이게 무엇인가 하면... 비평형 통계물리에서는 기본적으로 ground truth 분포 P을 알고있는 채로 empirical distribution F의 희소성을 생각하는데, 데이터사이언스는 정반대로 F를 알고있는 채로 P를 추정하는 것이다. 그래서 어떻게 하냐면 베이즈정리를 이용해서 조건부확률을 뒤집어준채로 large deviation을 한다. 간단히 키워드만 소개해주셨음에도 무척 재밌는 아이디어 같았고 오리지널 논문을 금방 찾을 수 있었다. 수학 논문치고는 그래도 물리학도가 이해할수 있는 수준으로 써놔서, 찬찬히 읽어보려고 한다.

한편 보스턴대학의 Mehta 교수님은 딥러닝이 왜 성공적으로 작동하는지에 대한 이론적 질문을 쉽고 재밌게 풀어주셨다. 나는 이번엔 모든 세션에 개근하나 했더니만 마지막 날에 호텔 말고 관악집에서 가느라 Mehta의 아침세션을 놓치고 말았는데... 이전까지는 딥러닝의 기초적인 내용(generalization, regularization 등)만을 쉽게 설명해주셨으나 하필 그 세션에서는 double descent 등을 포함한 모던한 이론적 understanding까지 인텐스하게 다뤄주셨다고 해서 후회가 되었다. 나중에 참고문헌 같은 거라도 올려주셔서 볼수 있었으면 좋겠다.

이번엔 우리 연구실 사람들은 나 포함 두명밖에 안 와서, 주로 우리랑 가까운 사이인 물리교육과 조정효 교수님 연구실 사람들한테 끼어서 같이 다녔다. 저녁시간에도 라구파스타, 텐동, 인도커리 등을 먹으러 같이 잘 다녔는데, 그러면서 이야기 해 보니까 머신러닝에 대해 이론적 깊이뿐 아니라 실용적(?) 감각도 많이 가지고 스터디도 다양하게 진행하는 열정적인 연구실인 것 같았고, 특히 내가 교양수준으로 좋아하는 디퓨전모델에 대해 최신의 흐름까지 자세히 알고 계신 것 같아서 앞으로도 더 많이 교류하면서 배우면 좋지 않을까 생각이 들었다.

이제는 school 파트는 끝났고, 다음주 월~화 동안 연구내용 발표를 하는 워크숍 파트가 남았다. 나는 이번에 포스터 발표를 하기는 어려운 상황이지만, 교수님들의 강연뿐 아니라 참석한 대학원생들의 포스터까지 한번 잘 들어보면 좋을 것 같다.

Facebook에서 이 글 보기: 링크

Saturday, October 29, 2022

A Road to 'Science of Semantics' (의미의 과학 및 의미 엔지니어링의 가능성)

이건 그야말로 잘 모르면서 하는 순전한 상상이기는 한데, 최근 머신러닝 분야의 발전과 발맞추어서, 그런 머신들이나 우리들의 두뇌 속에 '의미'가 어떤 방식으로 존재하며 그것을 어떻게 엔지니어링할지에 대한 학문 분야가 발달하게 된다면 굉장히 재미있을 듯하다.


부전공에서 '기호학'이라는 키워드를 알게 되어서 이래저래 찾아봤던 바로는, 특히 철학 쪽에서 이런방향을 지향하며 지적 고속도로를 깔아 두는 탐구들이 예전부터 이미 활발히 있어 왔기는 하며, 이들은 과학기술과의 협력에도 굉장히 적극적이다. 그런데 최근에 인공지능 분야의 발전에 힘입어 우리가 지능시스템을 어떻게 '뜯어봐야' 할지에 대한 효과적인 개념적 틀이 점점 생겨나고 있으니, 계기만 있다면 이러한 분야가 훨씬 더 폭발적으로 발전하지 않을까 한다. 이공계 쪽에서는 내가 종종 언급하는 스탠포드의 Surya Ganguli 그룹이 어느 정도 이런 걸 지향하고 있는것 같기도 하다.


말하자면 수량화된 기호학이라고 불릴만한 이러한 '의미 엔지니어링' 분야가 더욱 발달하게 된다면 계산신경과학과 인문학 최전선의 협력이 될것이며, 이러한 분야는 분명히 '공학'인데도 불구하고 상징과 직관의 찬란한 언어가 오가는 독특한 색채를 갖게 되지 않을까 한다.


이러한 의미 엔지니어링이라는 단어와 그 가능성은 다름아닌 영화 《인셉션》을 보고 나서부터 내 머리속 한곳에 늘 자리잡고 있던 것인데... 최근의 발전들을 보다 보니 이것이 그저 SF적인 상상이 아니며, 내 생애 안에 그런 비슷한 건 충분히 가능해질 수 있겠다는 생각이 들었다. 얼마만큼 그 존재를 신뢰해야 할지 모르겠지만 최면이나 자각몽 같은 각종 비일상적 정신상태도, 결국은 휴리스틱하게 해왔던 일종의 정신 엔지니어링이 아닌가.


좀 다른얘기일지 모르지만 자연어처리 쪽에서 GPT-3으로 대표되는 거대 언어 모델(Large language model)들도, 단지 그럴듯한 말을 적당히 흉내내는걸 넘어서 상당 수준의 reasoning 즉 논리적 기능이 자연스레 창발한다는게 보고된 것으로 알고 있다.


사실이라면 그런 기계들도 어느 정도 논리성, 합리성을 갖추고 결이 맞는 언어생성기제를 내적으로 갖출 수 있다는 것인데 (그리고 그 능력의 유무는 '정도의 문제'가 될수 있다는 것인데), 그 속에서 각 단어들의 의미가 어떻게 인코딩되고 인출되는지를 뜯어보고 실제 생물체와 비교할수 있다면 재밌을 것이다. 특히 실제 생물체들은 의미의 추상적 부호화가 시청각적 직관과 막 뒤섞여 있을거 같은데 반해서, 자연어처리 기계들은 그렇지 않을 것 같기도 하고.


사실 최근의 거대 언어 모델까지 가지 않고, 머신러닝 붐 초창기에 많은 사람들이 신기해했던 word2vec 같은 임베딩만 봐도 의미의 수량적 분석 가능성은 예고되어 있었다고 봐야 할 것이다. 단어들을 벡터공간 속 좌표로 임베딩했을 때, 예컨대 king에서 male을 빼고 female을 더했더니 queen이 나오더라 이런 것 말이다. 물론 실제 의미부호들의 존재방식과는 거리가 있을 것 같은 초등적인 부호화지만 아무튼 그렇다.


그리고 추상적인 의미들일수록 뇌 속의 네트워크에 보다 '분산적으로' 저장되어있을 듯한데, 그런걸 뜯어보면서 identify하고 사람마다 비교하려다 보면 지난 20년간 인터넷의 연결망 구조 분석 등으로부터 발전해온 '복잡계 과학' 및 네트워크 사이언스가 다시 한 번 크게 주목받을 수 있어 보인다.


다른 한쪽 극단으로 가 보자면 생명이나 안전에 관련있다던지 해서 좀더 본능에 가까운 대상들의 의미론은, 보편적인 의미 저장/인출 망으로서의 뇌에 소프트웨어적으로 올려진 것이 아니라 보다 낮은 레벨에 있는 '전용' 뇌 부위에 따로 저장돼있는게 아닐까 상상도 해본다. 특히 평소에 사람들의 언어생활 (그리고 언어생활에 발생하는 전형적인 결함의 패턴들) 을 보다보면 욕설이나 성적인 단어 같은 건 일반적인 단어들과 좀 다른방식으로 저장되고 인출되는것 같다는 느낌이 든다.


물론 전술했듯이 이런 건 아무것도 모른 채로 하는 상상이고... 또한 위에서는 언어 위주로 썼지만 의미라는 게 꼭 순전히 언어적인 것일 필요도 없고 비언어적인 시청각적 archetype들과도 막 섞여 있을 것 같고. 아무튼 앞서나가는 분들에 의해 이미 제대로 된 판이 깔려있을 것 같긴 하다. 취미삼아 follow-up해 보아야겠다.


Facebook에서 이 글 보기: 링크

Friday, October 28, 2022

[도서 소개] 경로적분에 대한 종합적 시야를 제공하는 책 (Chaichian and Demichev)

이론물리학의 중심 도구인 경로적분에 대해 두고두고 참고해볼 만한 책을 찾았다 (Chaichian and Demichev, "Path Integrals in Physics", 아래에 링크). 인용수도 300여 회 정도로, 상당히 쓸만한 책이라는 느낌이다.


양자역학의 기술방법으로서 리처드 파인만의 경로적분(path integral)은 물리에 관심있는 독자들을 위한 대중 과학서적에서 상당히 자주 등장하며, 어떤 입자가 움직일 때 가능한 모든 경로를 동시에 거치는데 그 경로들 중에 대부분은 상쇄되고 액션이 최소인 것만 살아남는다는, 다소간에 신비스러운 인상으로 언급된다.


그런데 사실 경로적분의 초기적인 모습은 파인만보다 훨씬 이전으로 거슬러올라가, 모든 점에서 미분불가능한 경로를 갖는 무작위 움직임인 '브라운 운동'을 수학적으로 정식화한 Wiener의 기여 (그래서 브라운운동을 수학 쪽 사람들은 Wiener process라고 부른다) 가 그 시작으로 비정되기도 한다. 이것이 디랙, 파인만 등에 의해 라그랑지안과의 연관성이 지적되면서 고도화되고, 양자역학 및 양자장론에 성공적으로 적용되면서 이론물리학에 많은 발전을 가져다주었다고 영문 위키백과에서는 설명하고있다.


그리고 90년대 이후로 발전한 현대적인 비평형 통계역학에서도, 입자가 특정 경로를 겪을 (고전역학적) 확률을 Onsager-Machlup 경로확률로 기술한다. 이는 통계역학적 관심사라는 점에서 Wiener의 직접적 후신이라고 할 수 있을것이며, 평균된 엔트로피가 아니라 '확률변수'로서의 엔트로피를 정의하는데에 쓰이는 매우 중요한 양이다. 또한, 희귀한 현상의 발생빈도를 말해주는 rate function을, 통계학에서 나오는 generating function의 르장드르변환으로써 구하게 해주는 large deviation theory의 관점에서도 이러한 경로확률을 바라볼수 있다.


그런데 Braket notation을 쓰면 통계역학에서의 이러한 경로확률이, 양자역학의 경로적분에서 말하는 propagator와 거의 비슷한 양이라는것이 드러난다. 이렇듯 경로적분은 양자역학뿐만 아니라 고전역학, 통계역학 등 여러가지 이론체계 각각에서 매우 유용할뿐 아니라 그것들 사이의 깊은 링크를 제공해서 서로 통합적으로 조망할 수 있게 해 주므로, 전술했듯이 이론물리학의 가장 중심적인 도구라고 해도 과언이 아닐듯하다.


이 책의 Volume 1에서는 random walk부터 시작하는 경로적분의 elementary한 construction과, 양자역학(quantum mechanics)에서의 경로적분을 다루고있다. Volume 2에서는 양자장론(quantum field theory) 및 통계물리학에서의 경로적분을 다루고, 마지막으로 Parisi와 Wu에 의해 도입된, 양자장론의 stochastic quantization까지 소개한다. 이들 각각의 픽쳐 내에서 잘 쓰인 책은 많이 있지만, 이 책은 내가 늘 쓸데없이 많이 궁금해하는 부분인, 서로 다른 픽쳐들 사이의 링크를 명시적으로 제공해줄것 같아서 기대된다.


<도서 정보 링크>

Sunday, October 16, 2022

능동물질 연구의 대가, M. E. Cates 케임브리지대학 루카스 석좌교수

아이작 뉴턴, 폴 디랙, 스티븐 호킹 등이 거쳐 간 케임브리지 대학의 석좌교수직인 루카스 석좌교수 (Lucasian professor of mathematics)는 2015년 이래로 마이클 케이츠 (Michael E. Cates) 교수님이 역임하고 있다.


이 분의 주 연구분야는 연성물질(soft matter), 그 중에서도 꾸준히 에너지를 소모하면서 평형으로부터 벗어난 채로 와글거리는 물질군인 능동 물질(active matter)이다. 박테리아들의 모임이나, 세포 내부의 복잡한 환경 등을 그 예시로 들 수 있다. 이러한 물질들에서는 일반적인 평형상태의 액체 및 기체에서는 나타나지 않는 상들 (작은 크기의 구멍들이 뚫려 있다거나, 유한한 크기의 방울들을 이루되 더 성장하지는 않는다거나) 이 나타난다.


Cates 그룹의 연구는 이러한 현상들에 대한 practical한 생물물리학적 모델링에 그치는 것이 아니라, 순수 이론물리에서 주로 볼 법한 미니멀한 통계장론(statistical field theory)적 접근 및 RG 해석을 적극적으로 채용하여 다양한 임계현상을 탐구하는 등 특유한 스타일을 가지고 있다.


나 같은 경우 미시적 디테일을 갖춘 사실적이고 정확한 모델링도 물론 좋지만, 미니멀한 원리와 멋있는 이론적인 포말리즘으로부터 탑다운으로 유도해나가는 걸 분수에 안맞게 무척 좋아한다. 그렇다 보니 나로서는 이런 스타일의 연구들이 꽤 마음에 든다. 이분의 구글 스콜라 페이지 (링크) 에 들어가서 보면, 최고 저널인 PRL과 PRX에만 대체 몇개를 쓰신 것인지 셀 수 없어서 놀라게 된다.


우리 지도교수님도 임용 직전까지 Cates 그룹에서 포닥을 하셨는데, Cates와 이름이 직접 같이 올라간 논문은 없지만 Cates와 늘 같이 일하는 (주로 유럽 쪽) 분들이랑 함께 논문을 여럿 쓰셨다. 나 또한 학위과정 동안, 혹은 포닥 때 이분들이랑 협업할 기회가 생긴다면 좋을듯하다.


Facebook에서 이 글 보기: 링크

Thursday, September 22, 2022

Optimal transport accelerates the score-based generative modeling

<Midjourney가 시간과 에너지를 아끼려면? : 최적수송이론에 근거한 최신의 연구 소개>


Diffusion model (혹은 사실상 거의 같게 사용되는 용어로, score-based generative models) 은 최근에 머신러닝에서 크게 각광받고 있다. 특히 사용자가 prompt를 입력하여 원하는 이미지를 생성해내는 text-to-image generation의 경우는 매우 커다란 데이터셋과 모델에 힘입어 Midjourney, StableDiffusion, DALL-E 2 등의 서비스로 출시되기도 했다. 이들 서비스는 의미론과 텍스쳐 양쪽에서 명백히 '창의적'이라고 말하고 싶을 정도로 뛰어난 피쳐 학습 및 재조합 능력을 보여주며, 단순히 학계 내의 주목을 넘어 예술분야 및 호사가들에도 새로운 영감과 고민을 제공하고있다.


나는 이미 작년 12월에 wombo라는 서비스를 접하고 포스팅을 했었다 (블로그에서 해당 글 읽기: 링크). 해당 서비스는 디퓨전 모델은 아니고 GAN의 한 변형인 VQGAN이라는 모델을 이용했는데, 이미 상당히 창의적인 이미지를 생성해주었다 (이를테면 내가 입력해본 프롬프트인 'nvidia building', 'mecha donald trump' 등이 있다). 그러나 모델의 설계 자체가 가진 한계인지, 아니면 컴퓨팅 파워의 한계인지, 이미지가 선명하지는 않고 모호하게 뭉개져있는 듯한 느낌이었다. 사실 generative art라고 하는 분야에 추상적인 패턴뿐만 아니라 의미론이 들어오는걸 오랫동안 소망해온 나로서는 이 정도만 해도 엄청나게 신기한 결과긴 했다.


한편 디퓨전 모델의 경우는 일부 task에서 GAN을 넘는 성능을 보이는 등 성공의 가능성이 보이자, 대량의 컴퓨팅 파워와 고급의 엔지니어링이 투자되어, 매우 선명하고 모든 부분을 식별가능한 이미지들까지 만들어낼 수 있게 되었다. 이는 위에서 말한 유료 서비스들의 출시와 본격적 유행으로까지 이어질수 있었다.


이 글에서는 이러한 디퓨전 모델의 기본적인 작동원리와, 그 가장 큰 문제점을 상당부분 해결할 것으로 기대되는 최신의 연구에 대해 간단히 소개해보도록 한다. 옆 연구실과 함께하는 세미나에서 발표한 자료를 하단에 첨부한다 (슬라이드별 간단한 설명은 차근차근 추가예정).


디퓨전 모델의 기본적인 컨셉은 다른 복잡다단한 인공지능 모델들에 비해 비교적 간단하고 우아한 편인데, 이는 물리학, 화학 등에서 종종 등장하는 현상인 확산(diffusion) 및 그것을 기술하는 비평형 통계역학 (non-equilibrium statistical mechanics)의 방법론에 근간을 두고 있다.


사람 얼굴 데이터, 숫자 손글씨 데이터 등 모든 이미지 데이터셋은 각각의 '분포'를 가지고 있다. 무슨 뜻이냐면, 존재할 수 있는 수많은 이미지(=2차원 행렬)들 중에, 사람 얼굴 사진처럼 생긴 이미지는 극히 일부일 것인데, 모든 가능한 이미지들을 모아놓은 추상적인 공간 상에서 자기들끼리 비교적 가깝게 모여서 어떤 덩어리를 형성하고 있을 거라는 뜻이다.


그런데, 모든 가능한 이미지들의 공간에서 아무 점이나 골라보면 마치 TV 잡음처럼 랜덤한 이미지일 가능성이 압도적으로 높다. 그런 공간에서 사람 얼굴처럼 생긴 이미지들의 모임을 생각하면, 그 윤곽은 꽤 복잡하고, 들쭉날쭉하게 생겼다고 생각할수 있다.

(물론 차원 자체가 워낙 높아서 생각보단 괜찮게 생겼을지도 모르나, 이 경우에는 sparse함이 문제가 된다. 이런 문제를 그나마 개선해줄 수 있는 게, 휘어진 평면을 다루는 기하학인 Riemannian manifold를 도입하는 것이다. 실제로 머신러닝에 많이 적용되고 있으며 디퓨전 모델에도 적용한 연구들이 속속 나오고 있다)


다만 우리가 실제로 그 분포를 알고 있는 것은 아니다. 우리는 그 분포를 따르는 여러 개의 점들 (이미지들) 만 가지고 있다. 점들을 알고 있으니 대충 윤곽을 따라갈 수 있지 않냐고 할 수 있는데, 굉장히 정확한 지적이다. 그러나 고차원이고 커다랗기 때문에 현실적으로는 어렵고 이에 기계의 힘을 빌리고싶다. 만약에 그 분포의 윤곽 자체를 안다면, 사람 얼굴이면 얼굴, 숫자면 숫자, 풍경이면 풍경 등, 기존에 존재하지 않았지만 분명히 사람 얼굴에 해당하는 (혹은 다른것에 해당하는) 이미지를 만들어낼수 있을 것이다. 이게 생성모델의 기본 개념이다.


어떻게 그렇게 할 수 있을까? 다양한 방법이 있는데, 디퓨전 모델에서는 먼저 이러한 복잡한 분포에 작은 노이즈를 단계단계 조금씩 집어넣어, 커다란 공간 전체를 비교적 균일하게 채우는 정규분포 같은 분포로 바꾸어준다. 이는 '좁은 용기 속에 있던 기체분자가 방 전체로 퍼져나가는 것', 즉 확산에 비유할 수 있다. 그런데 사실은 비유일 뿐 아니라 수학적으로 정확하게 똑같게 기술된다. 이를 분포를 '부순다'고 표현하자.


그 때 분포가 어떻게 부서지는지 그 양상을, 인공신경망을 이용해서 학습하자. 인공신경망은 기본적으로 뭐든지 흉내낼수 있는 매우 커다란 함수라고 보면 된다. 아무튼 이렇게 부서지는 양상을 알았으니, 반대로 균일한 분포 (위에 말한 TV 잡음 같은걸 모두 포함한) 로부터 원래 분포를 만들어낼 수 있다 (약간만 더 테크니컬하게 말하면 베이즈 정리에 근거해서 조건부확률을 뒤집어주는 것이다).


그러나 디퓨전 모델의 매우 큰 문제점은, 원래의 좁은 분포를, 전체 이미지들이 이루는 고차원 공간을 균일하게 채울 때까지 단계단계 조금씩 부수면서 학습해야 하기 때문에 학습과 생성에 너무 많은 시간이 걸린다는 것이다. 이 문제는 신경망의 크기를 키운다고 해결되는 것은 아닌듯하다.


이번에 소개한 논문인 Diffusion Schrodinger Bridge에서는 이 문제를 해결하기 위해, 최적 수송 이론 (optimal transport) 및 그것의 변형인 슈뢰딩거 브릿지 (Schrodinger Bridge)를 도입한다. 최적수송이론은 어떠한 분포 p0을 다른 분포 p1로, 유한한 고정된 시간 내에 반드시 보내게끔 강요하는 (정확히 말하면, 최소의 비용으로 그렇게 보낼수 있는 구체적인 경로를 찾는) 것에 관한 이론이다. 딱 들어도 위에 말한 디퓨전모델의 문제점 해결에 적용될 수 있겠다는 직관이 든다.


최적수송 이론을 약간 변형시킨 슈뢰딩거 브릿지 문제는, IPF 알고리즘이라는 기존에 잘 정립된 방법을 통해서 풀 수 있다. 대략적으로 설명하자면 처음에는 마지막 분포 p1을 고정시킨 채로, 그 다음에는 처음분포 p0을 고정한채로, 그 다음에는 다시 p1을 고정한채로... 이런식으로 왔다갔다 하면서 좁혀서 점점 p0에서 p1으로 가는 좋은 경로를 찾아준다. 실제로 저자들은 이 방법을 적용해서, 데이터 분포를 노이즈 분포로 부수는 과정을 가속(혹은 단축)시켜 준다.


그 결과도 상당히 괜찮아서, 기존의 디퓨전 모델보다 훨씬 짧은 시간에 원하는 사람얼굴 이미지를 나름 선명하게 만들어낸다. 한편 재밌게도, 노이즈로부터 원하는 사진들을 만들어내는 것뿐만 아니라, 서로 다른 두 분포를 내삽(interpolation)하는 것도 가능하다. 무슨 말이냐면, 숫자들과 알파벳글자들 사이의, 혹은 땅속 풍경과 바닷속 풍경 사이의 '가장 자연스러운 연결'을 찾아줄 수 있다는 것이다 (물론 기준에 따라 다르며 딱히 과학적 진리 같은것은 아니다).


아무튼 매우 흥미로운 아이디어이고, 앞으로 사람들이 이것을 더 큰 모델들, 더 어려운 task에 대해서까지 이게 잘 적용되는지, 그리고 end-to-end로 잰 실제 시간과 자원이 절약되는게 맞는건지 등을 테스트를 해보면 좋겠다. 만약에 더 어려운 문제들에 대해서까지 결과들이 꾸준히 잘 나온다면, 각광받는 디퓨전 모델의 큰 문제가 꽤나 해결된 셈이겠다.


Tuesday, September 20, 2022

빛으로 작동하는 인공지능

이전에 우연히 접하고 신기해서 포스팅 했던 전기과 유선규 교수님(https://waves.snu.ac.kr/research)은 박사 때는 플라즈몬 같은 걸 하셨고, 지금은 질서가 깨져있는 물질의 설계 쪽과 함께, 전기 대신 빛으로 작동하는 인공신경망의 설계를 연구 테마로 잡고 계신다.


그런데 마침 요새 analog optical computing이 나한테까지 전해 들릴 정도로 업계에서 굉장한 화두가 되고 있는 모양이다. 유 교수님 연구실 소개를 보고 그때는 지적으로 신기하다고만 생각했는데, 프랙티컬한 관점에서도 시의적절하게 매우 좋은 연구주제를 설정하신 것 같아 멋진듯하다.


머신러닝을 개선하는데 쓰이는 핵심적인 아이디어들을 보면, 물론 디지털 하드웨어를 효과적으로 쓰도록 로우레벨에서 개선하는것도 엄청 중요했지만, 이해와 활용에 있어서는 대부분 아날로그한 알고리즘들이 크게 작용하고 있는듯하다 (그래서 컴공의 여타 분야에 비해 머신러닝에서는 선대, 미적분학 등이 유독 더 강조되는 것이기도 하겠다). 극단적으로는 그러한 아날로그 알고리즘이 머신러닝의 요체이고, 디지털 컴퓨터는 그러한 아날로그 알고리즘을 원하는대로 쉽게 implement 하게 해주는 플랫폼 역할이라고 생각할수도 있다.


이런 센스에서, reservoir computing이라고 해서, 수많은 비선형 자유도를 가진 시스템이라면 (이를테면 물 담아놓은 바가지(...) 등 물리적 시스템들을 포함하여) 뭐든지 사용할수 있는 아날로그한 딥러닝도 제안된 바 있다. 그러나 여기서는 그 비선형 자유도 전체를 시시각각 업데이트 하는것이 아니라, 말단에 있는 상대적으로 조그만 뉴럴넷만 트레이닝 시켜서 원하는 함수의 윤곽을 뽑아내게 된다.


아직 analog optical computing이 어떤 것인지는 잘 모르지만 reservoir computing과 약간은 비슷하게, 그러나 전자 기반의 디지털 집적회로처럼 매우 세심히 디자인된 광회로를 만들어가지고서 머신러닝을 비롯한 계산을 하겠다는 듯하다.


Genuine analog의 장점은 명백하다. 자연은 나비에-스톡스 방정식 등의 복잡한 편미분방정식을, 말하자면 매 순간 아주 쉽게 근사적으로 푼다고 할수 있다 (방정식이 정확히 캡쳐하지 못하는 건 stochasticity로 간주될테다). 이는 근본적으로 에뮬레이션인, 컴퓨터속의 아날로그와는 다른것이다. 한편 아날로그의 큰 단점으로는 어떤 디자인을 바닥부터 원하는대로 쌓아올리거나, 요소 하나하나 값을 시시각각 컨트롤하기가 어렵다는 게 있다.


후자의 특징 때문에 생각보다 시간과 에너지가 드라마틱하게 절약되진 않을수도 있겠단 생각은 든다. 만약 기존 디지털컴퓨팅 노하우들과 시너지를 이룬 좋은 광회로가 나와서 이런 점들에서 breakthrough가 일어난다면 우리가 아는 컴퓨팅의 모습에 근본적인 도약이 생길수도 있지 않을까 한다.


Facebook에서 이 글 보기: 링크

Thursday, September 15, 2022

논문 초안을 쓰며 느낀 점: 책임있는 글쓰기를 자연스럽게 하는 법

작년 말에 연구를 마무리하고 논문으로 정리하자고 하셔서 인트로 및 부록 빼고 본문까지는 대략 써 보았었다. 그때 내가 임의로 해서 교수님께 가져간 목차를 교수님도 거의 비슷하게 구상하고 계셨어서 기분이 좋기도 했었다. 내용을 소개하는 방식이 straightforward하지만은 않은데 꽤 구체적으로 비슷했어서 신기했던 기억이다.


하지만 그 이후 약 아홉 달 동안, 기존 내용을 refine하고 추가적인 연구 내용 (efficiency at maximum power (EMP)) 을 얻느라 섭밋 계획을 한번 엎었다. 그 사이에 새로 얻은 EMP 쪽을 메인으로 해서 이번 3-4주간 거의 새로 쓰다시피 했고 연휴 직후에 교수님께 보내드렸는데, 이번엔 정말로 마무리하자는 느낌이시다.


초안을 써 보면서 여러가지 느낀 게 있다. 먼저 영문으로 이정도 분량의 글을 써 본 건 사실상 처음인 탓에 (학부 졸업논문들이랑 인문대수업 리포트들도 전부 국문으로 썼음), 내가 쓴 글임에도 글의 전모가 한 눈에 들어오진 않아서 불안감은 가지고 있다. 아마도 아카이브에 올리기 전까지 교수님께 피드백 받는 과정에서 계속 살펴보면, 좀 더 이 원고와 친해져서(?) 한 눈에 이슈들이 보이지 않을까 싶다.


사실 본문에서는 그냥 내가 연구한 내용을 잘 표현하면 되니까 좀 테크니컬한 고민들이랑 수식 입력의 귀찮음 위주로만 있었다면, 좀더 고차원적인 창작의 고통(?)은 인트로 부분에서 주로 있었다. 그런데 한편으로는, 쓰기 전에 막연하게 걱정되던, 혹은 다른 논문들 읽으면서 '와 이런걸 번거로워서 어떻게 하나' 싶어서 걱정했음에도 막상 써 보니 생각보다 자연스럽게 해결이 되는 것들도 많이 있었다.


그중 대표적인게 레퍼런스 다는 것. 다른 논문들의 레퍼런스 보면 기본 50-60개는 되는 느낌이라 처음에는 저걸 대체 어떻게 하지 싶었는데, 첫 연구를 그래도 몇년 붙잡고 있었다 보니, 정말 직접적인 참고가 되는 문헌만 정리해도 30-40개 정도로 생각보다 적지 않게 나오더라. 여기에 직접적인 방법론적 참고는 안 되더라도 연구사적 맥락에서 반드시 인용해야 하는 논문들 및 설명이 잘돼있는 리뷰 논문들을 인용하고, 20세기 초반에 쓰인 근본 논문들도 방법론 언급할 때 예우 차원(?)에서 인용하면, 50-60개는 억지스럽게 채운다는 느낌 없이도 금방이다.


그런데 우리 교수님이 원생/포닥 때 작성하신 논문들을 보면 인용을 같은 업계에 비해서 정말 무척 적게 하시는 편인듯하다 (주도적으로 쓰신 논문에서는 30개 미만 인용하신 경우가 많음). PPT 같은거 봐 주실 때도 과장된 표현이나 레토릭한 표현을 지양하시는데 이런 것과 뭔가 일관되게 느껴지기도 한다. 내게도 그런 방향으로 지도를 해주실지도 궁금하기도 하다.


다음은 유사도 문제. 워낙 조심해야 한다고 주의가 많길래 고통을 받을것으로 예상했는데 생각보다 전혀 그렇진 않았다. 아무리 본문이 아닌 선행연구조사 부분이더라도, 내가 원하는 딱 그 맥락과 뉘앙스에 exact한 문장이 다른 논문들에 많이 있는 게 아니라서, 다른 논문을 일단 긁어오자는 생각 자체가 안 들고 내가 직접 써서 다듬게 되더라. 간혹 정말로 질투날 만큼 맘에 쏙 드는 문장들도 있긴 한데, 확률상 대부분은 내가 필요로 하는 문장들이 아닌지라 그냥 기억하고 기록만 해둔다.


결국 표현하고자 하는 바가 명확하게 존재하고 그것에 대해 많이 생각을 해봤다면, 표절을 피하는 것은 내가 갖고있는 문장을 억지로 paraphrasing하는 힘든 과정이 아니라, 나쁜 마음 먹지 않는다면 나름 자연스레 이뤄지는 과정인듯 (반면에 예술창작, 특히 음악에서는 훨씬 어려울 것 같음).


우리 active matter 분야에서는 과장좀 섞어 모든 논문이 거의 똑같이 시작하는데 ("active matter는 개별 입자의 수준에서 주변으로부터 에너지를 흡수하여 운동으로 전환시키며 와글거리는 물질이다" 이 정도의 뜻), 이런 건 약간 예외적일 수도 있겠다. 다만 이런 것조차도, 다른 논문들의 문장을 직접 참고하되 표현을 바꿔 쓴다는 느낌이 아니라, 뜻의 덩어리를 머리속에 기억해두고 그걸 글에 녹여낸다는 느낌으로 하면 문제가 생기지 않게 잘 할수 있다. 만약 100년 동안 연구가 쌓인다면 정의는 그대로인데 표현의 가짓수는 한정적이니 표절문제가 생길수 있겠지만, 그때는 연구 트렌드가 달라져서 첫문장이 달라지겠지(...).


카피킬러 같은 건 아직 안 해 보았고 교수님의 피드백과 첨삭까지 마치면 해볼 예정이다. 글쓰기에 있어서는 스타일이 확고하시고 굉장히 꼼꼼하셔서 아마 많이 바뀌어서 돌아오지 않을까 생각해본다. 실제로 무척 인자하고 점잖은 분이신데, 교수님 말씀으로는 대학원생때 유일하게 짜증나셨을 때가 동료 논문 첨삭해 줄 때였다고 하신다.


그리고 연구노트 좌측여백을 사실상 영어 단어장처럼 사용하고 있다. 나는 맘에 쏙 드는 단어가 보이면 어떻게든 내것으로 만들고 싶어하는데 (이것은 페북이나 블로그에 글을 쓸때도 마찬가지임) 그러다보니 언젠가 내 글에 써먹으려고 적어두게 된다. 텝스 공부할 때도 단어 억지로 외우는걸 제일 힘들어했는데 (사실 제대로 안하고 청해/독해점수로 비볐음...), 글쓰기라는 목적이 있으니 영단어 공부도 자연스럽게 되는구나 싶다.


그리고 그런 단어들이 과연 맥락에 맞는 뜻인지를 보려면 영영사전을 찾는 게 매우 도움이 된다는 걸 알았다. 예문도 예문이지만, 뜻이 정확히 논리적으로 해설된 걸 보는 것도 생각보다 꽤 유용하다. 이를테면 내가 정의한 어떤 양을 여지껏 composite efficiency라고 이름붙이고 사용해 왔는데, 찾아보니 composite가 내가 생각하던 그런 뉘앙스와는 좀 다른 뜻이라, 영영사전을 찾아가며 comprehensive efficiency로 바꾸게 된 일이 있다 (물론 교수님께서 어떻게 판단하실진 모른다). 그리고 남의 논문 읽을 때도, 그냥 수식 따라가며 공부하는 입장이 아니라 논문을 써야되는 사람 입장에서 읽으니까 예전과 달리 어휘 같은 게 눈에 좀더 들어오는 듯.


아무튼 첫 연구는 교수님이 하사해주신 토픽이지만 내 맘에 쏙 드는 지적 방향성이었고, 그럼에도 불구하고 내가 갈피를 못잡던 시간이 길어서 연구가 늦어지다 보니 슬슬 비슷한 문제의식의 논문이 많이 나와서 연구가 처음보다는 덜 novel하게 된 느낌인데... 그 논문들이 모르고 있는 걸 내가 아는 게 아직은 꽤 남아있다고 생각은 하지만, 그래도 시간문제겠다 싶어서 초조한 기분이 많이 든다. 이젠 정말로 빨리 제출하고 다음 연구주제로 넘어가보고 싶다.


Facebook에서 이 글 보기: 링크

Tuesday, September 13, 2022

Neural style transfer를 처음 접했던 일, 그리고 컴퓨터 공부의 잘못된 방법

딥러닝을 아주 막연하게만 알다가 처음으로 그 놀라운 성능, 그리고 크리에이티브한 분야에의 응용가능성을 접한 것은 바로 style transfer 쪽에서 가장 히트쳤던 논문 중 하나인 "A neural algorithm of artistic style" 논문을 접하고서였다.

(당시 버전: arXiv 링크. 이후 CVPR 2016에 "Image style transfer using convolutional neural networks"라는 제목으로 억셉되었다. Google scholar에서는 인용수를 병합하여 집계하고있음. 해당 버전: 링크)


그 논문을 소셜미디어에서 우연히 접하고 너무 감명받아 페이스북에 글을 썼었다. 지금 보니 말투가 킹받기는(?) 하지만, 당시의 소감을 느낄 수 있다보니 재미있어서 다시 가져와본다 (해당 Facebook 게시물: 링크).


저 때 나는 패턴인식에 막연하게나마 관심이 있어서 전기과 해동 도서관에서 책 빌려서 공부하던 터였다. 그 때 공부하던 건 공간상에 빨간 점파란 점이 뿌려져 있는데 직선으로는 구분되지 않을 때 비선형함수들의 합성으로 어떻게 구분선을 그을지 등 기초적인 내용이었다. 그런데 갑자기 접한 neural style transfer는 아득히 멀게, 그야말로 마법에 가깝게 느껴졌던 것 같다 (사실 지금도 그렇다).


하여튼 저런 게 내 센트럴한 흥미를 깊이 자극했지만, 이미 너무 잘 발전해버린 바람에 내가 기술적으로 이해하고 활용할수는 절대로 없을 것 같다고 생각했었다. 그리고 그런 기분은 머신러닝 기술 발전소식을 팔로업하면서 8년째(...) 계속 느끼는중인데... 그 기간 동안 아무 때라도 좀더 용기내서 dive in 해 보았다면 좀더 여러 가지의 좋은 기회를 얻을 수 있지 않았을까 해서 아쉬움도 있다. 농담섞인 얘기지만 물리를 잘 하는 게 딥러닝에 도움 된다는걸 늘 생각했고 또한 실제로 목격해왔는데, 지금은 내 전공인 비평형 통계물리의 핵심 아이디어들까지 머신러닝 피플들이 적극적으로 익히고 있는 바람에, 통계물리 바탕으로 그쪽에 새로운 뭔가를 던질 수 있는 여지가 거의 사라지고 있는 것 같아서 말이다.

아무튼 당시에나 지금이나 컴퓨터에 워낙 친숙하지 않다보니, 저때는 소스코드 등이 다 공개되어 있으니까 그대로 가져다가 돌려 보면 된다거나 하는 것도 아예 몰랐었고 철저히 아날로그적으로 (수학이나 물리 공부하듯이) 공부했다. 그러느라 머신러닝에 쓰이는 수식들이랑 초보적인 매트랩(!?)에는 빠삭해졌지만, 파이썬 라이브러리로 직접 뭔가 만들 줄 아는 실속은 전혀 없이 시간 낭비를 많이 했던 것 같다. 컴퓨터라는 건 바닥부터 안해도 이미 있는거 따라하면서 부딪혀보면 되는거라고 옆에서 한마디라도 누가 좀 알려줬더라면...

하여튼 그 이후로 물리학이랑 미학 공부한다고 정신없느라 이쪽 공부는 안하다가 (미학을 공부하게 된 계기 중에 하나가 사실은, 딥러닝이 발전하는걸 보며 기술과 문화예술의 상호작용에 관심이 생겨서이기도 하다), 2018년 초에 원래 알던 전기과 형이랑, 의대 신입생 두명이랑 같이 굿펠로 책 스터디하면서 좀 다시 따라가게 됐던 것 같다. 그 책은 연구실 출범 초기에 교수님께서 빌려 가셨다.

Facebook에서 이 글 보기: 링크

Thursday, September 1, 2022

점점 각광받는 디퓨전 모델(diffusion model)

생성모델 분야를 매일같이 혁신하고 있는 학습 스킴인 diffusion model 쪽에서 유명한 Yang Song (Google scholar: 링크, 개인 홈페이지: 링크) 이 이번에 스탠포드 박사 졸업 하시면서 바로 칼텍 교수로 임용되신 듯하다.


이 분이랑, 스탠포드 Ganguli 그룹(홈페이지: 링크)의 여러 alumni 및 그 근처 동료 분들(S.S. Schoenholz, J. Sohl-Dickstein, J. Pennington, Jaehoon Lee 등)이, 수학 및 물리학을 바탕으로 머신러닝을 이론적으로 연구하면서 FAANG에도 걸쳐 있을 수 있는 멋진 포지션 창출의 제일 모범적이고 성공한 케이스들인 것 같다.


Ganguli 그룹에서는 디퓨전 모델은 사실 극히 일부분이고, 기존 딥러닝 이론에 물리 적용하는걸 꾸준히 다양하게 하시며, 인공지능뿐 아니라 생체 신경망의 정보 인코딩에 대한 이론적 분석 같은 것도 활발히 하시는 듯. 어째 다 스탠포드네....


나도 9월 초에 논문초안 내고 나면, 네이버웹툰 지인이랑 같이 올해 초에 디퓨전모델 스터디 하던 걸 자투리시간에 마무리 해서 블로그에 정리나 해둘 생각이다.

- diffusion model 기초: 물리학의 시야에서

- diffusion Schrödinger bridge

- Riemannian manifold에서의 diffusion model

- 미학적(?) 함의

아무튼 우리 분야로부터 강하게 inspired된 방법론인 디퓨전모델이 재작년부터 점점 뜨더니 위에 말한 스터디 그만뒀던 한 반년도 안 되는 사이에 대중적으로도 많이 알려질정도로 커다란 성공을 거둬서 기쁜마음 반 초조한마음 반임.

초조한 이유는 디퓨전모델이 워낙 각광받다 보니 이제 머신러닝 피플이 비평형통계물리 계산을 우리들보다도 잘하게 되는게 시간 문제겠다 싶어서 ㅋㅋ 현재 이론물리의 정수이자 에쎈스는 장론이랑 RG라고 생각하는데 이들도 혹시 IT 최전선에 응용돼서 빼앗기기(?) 전에 깊게 공부해서 저점매수 해 두어야겠다. 실제로 이미 응용의 시도들도 파편적으로 꽤 있고.

난 교양수준이긴 하지만 크리에이티브한 작업의 assistant로서의 머신러닝에 늘 관심이 제일 많은 편이다. 세계의 근본 요소가 아니라, 세상에서 어쩌다 생겨난 여러가지 것들에 대한 '법칙 아닌 법칙'(말하자면 패턴?)들을 경험적으로 파악해서 재조합하는 걸 전통적으로는 예술가와 그 조수들이 잘 했는데, 머신러닝이 잘 하는. 것도 딱 그런거고. 그렇게 파악된 '법칙 아닌 법칙'을 뜯어보는 것에 내가 원체 관심이 많기도 할 뿐더러, 그런것들이 역으로 각 부문별 창작활동이란 과연 무엇인지에 대해 더 깊은 이해까지 제공할수 있다고 생각함.

DALL-E 2나 Midjourney 등으로 요즘 핫한, diffusion model의 예술창작 같은 경우도 그래서 매우 맘에 든다. 그런데 이것은 결국 블랙박스 단계를 넘어 semantic 및 style을 체계적이면서도 쉽게 이해, 추출, 변경 가능해질 때에 지금보다도 더욱 커다란 비즈니스적 breakthrough가 생길것 같음. 별로 챌린징한 태스크는 아닌 것 같고 (통합적으로 예쁘게 안된다면 덕지덕지 붙여서 만들면 되니까) 돈 많이 될 테니까 아마 금세 누가 만들겠지.

Facebook에서 이 글 보기: 링크

Friday, August 5, 2022

9th Soft Matter Summer School: Active Soft Matter 참여 후기 - (2)

오랜만에 우수 발표상을 받았다. 부상으로 2TB SSD도 받았는데 어떻게 쓰면 좋을지는 찾아봐야겠다.


총 7개 상 중 나포함 2개를 우리 연구실 멤버가 받았다. 전체 포스터가 열몇 개이긴 했지만 암튼... Active soft matter의 글로벌한 대가 분들한테 포스터 내용 소개하고 핵심 메시지를 전달해 보는 것 자체만으로도 뜻깊은 시간이었던 듯. 다만 정작 내 연구와 매우 직접적으로 관련이 있는 연사분들(Cates, Ramaswamy 등)은 줌으로만 렉쳐 하셔서 포스터 보여드릴 기회가 없었던건 아쉬움.


심사교수님들과 동료들로부터의 꽤 중요한 피드백들 (+그리고 그걸로부터 시작된 여러가지 생각들) 도 있었다. 먼저 내 연구의 문제의식 중 odd-parity variable을 다루는건 다소 이론적인 열역학쪽 관심사로부터 유래된 것인데, soft matter 커뮤니티에서는 좀더 손에 잡히는 설명이나 실제적인 기대효과, 혹은 bottom up construction을 원하는것 같았다. 고등과학원 학회 때는 정반대로 추상적인 원리에서 시작하는 top down 모델수립에 많이들 관심을 가지셨었는데... 암튼 사실 작년 봄에 좀 해보다가 그만둔 일인데 다시 해봐야 하나 싶다.


다음으로는 work의 fluctuation 문제다. Active matter를 이용한 엔진이 여러의미로 전통적 엔진보다 성능이 매우 개선될 수 있음을 보였지만 그때 일의 요동은 커진다는 걸 인지하고는 있었는데, 이론적 흥미를 넘어 실제 유용성을 찾고자 할 경우 이 문제에 대해 정확히 언급 해주면 좋을 것 같다. 아니면, work 자체가 워낙 많이 개선되니까 '상대적 요동'을 찍어본다면 생각보단 괜찮을수도 있고.


그렇지 않다면 아예 후속 연구로, 에너지를 더 써서라도 fluctuation의 크기가 원하는 수준 이하로 보장되도록 집어넣는 제어의 방법 같은 것도 생각해볼 수 있을듯 (사실 이런쪽이 늘 넘 재밌게 느껴짐). Thermodynamic uncertainty relation은 precision을 좋게 하려면 그만큼 에너지 소산이 필요하다는걸 알려주지만, 에너지를 소산시킨다고 반드시 precision이 좋아지는건 당연히 아니니까 말이다.


다음으로는 연구실 동료들이 얘기한, odd와 even parity의 (혹은 각자끼리의) cooperation 효과도 해 볼 만 하겠다. 이것도 연구 맨 처음 단계부터 얘기는 나왔었는데, 일단은 인터랙션이 없는 모델이다보니 여러 입자를 섞어놔도 재미없고 trivial한 interpolation에 그칠것이 거의 확실하다. 근데 상호작용을 잘 주면 입자간의 직간접적 협력에 의해 양적인 개선뿐만 아니라 질적으로 새로운 현상도 볼수 있지 않을까 싶기도 함. 그러한 협력현상이 좀더 우리가 active matter에서 초롱초롱한 눈빛으로 기대하는 바이기도 하고. 물론 이것도 지금 연구에서 해결을 볼 사항은 아니고 ,후속으로 생각해보자 정도.


그리고 나는 일단은 active matter에 대해서 공학 활용이나 생체계 원리 설명을 염두에 둔 soft matter 커뮤니티 쪽 흥미보다는, 흥미롭고 새로운 비평형 현상들을 볼수있는 테스트베드(?) 느낌으로 생각하는 통계물리/통계장론쪽 이론 커뮤니티의 흥미로 더 관심이 있는듯하다. 지금 연구는 양쪽중 어디에도 속하지 않는 애매한 상태인데 다음부턴 어떻게 pose하고 풀어나가야 할지 고민이 많이 들기도 한다.


Facebook에서 이 글 보기: 링크

Monday, August 1, 2022

9th Soft Matter Summer School: Active Soft Matter 참여 후기 (1)

UNIST에서 개최된 '9th Soft Matter Summer School: Active Soft Matter'(행사 홈페이지: 링크)에 참여하고 있다.


이번 행사도 평소의 여러 워크숍들처럼 연사분들이 연구 소개 발표 하시는 줄 알았는데, 써머 스쿨이라는 이름에 부합하게 방법론적인 것에 초점을 두고 학생들 공부에 좀더 직접 도움이 되고자 하는 느낌으로 진행이 되었다.


우리 통계물리 쪽에서도 이번스쿨의 주제인 active matter를 매우 열심히 다루긴 하지만, 아예 soft matter라고 이름이 걸린 행사에 오니까 설명과 질의응답의 포인트에도 묘하게 차이가 있고, 확실히 평소와 다른 커뮤니티에 와 있구나 느낌이 드는 점도 재미있었다 (물론 당연히 교집합도 많다). 팀플 같은 게 없다보니 얘기할 기회는 적어서 잘 모르지만 아예 biology 백그라운드 분들도 상당히 계신 모양임.


다만 만약에 (우리 윈터스쿨처럼) 주제가 아예 좁았거나, 관심사별로 세션 나눠서 진행을 한다면 실험이면 실험, 이론이면 이론 정말로 깊게 배워갈수 있을텐데, 다같이 듣는 것이다보니 여전히 약간 애매한 점은 있었다. 몰랐던 분야라면 이런게 있구나 정도, 아는 분야라면 크게 챌린징하지 않은 복습느낌.


연사 모두가 말그대로 어디가서 plenary session 맡아 하실 정도의 분들이라, 관심사에 따라 세션 나눠서 하는 식으로 진행할게 아니긴 했다. 청중 전체의 general interest를 만족시키면서도 방법론적으로도 어느정도 take home message가 있게끔 균형있게 잘 구성된 듯하다.


개인적으로는 내 지금 연구에서 꽤 중심적으로 참고하고 있는 Ramaswamy 교수님의 연구(논문 링크: 클릭)를 저자직강(?)으로 설명 들어서, 다 제치고 이게 무척 유익하기도 했다. 내가 다루는 문제가 서 있는 지형을 이해하고 나서는 연구 스쿱당할까 싶은 조급함이 좀 줄긴 했었는데, 이걸 들으니 내 연구문제에 다가가는 길이 너무 클리어하게 보이는 느낌이라 그래도 빨리 써서 내야겠다는 생각이 든다.


이외에도 헷갈리던 것들을 좀더 확실히 알고, 잘 아는 티를 효과적으로 내려면 어떻게 말해야 하는지 컨벤션 같은 거랑, 앞으로 anchor 삼을 응용쪽 레퍼런스 문헌들을 많이 알아가는 걸로도 만족이다.


Facebook에서 이 글 보기: 링크

Friday, July 29, 2022

학위논문 구성에 대한 때이른 상상

일반 논문들에 비해 박사학위논문들은 많이는 안 읽어 봐서 그 구성의 전략 같은 걸 잘 모르지만, 학위과정 중에 다뤘던 개별 문제들을 꿰뚫는 하나의 스토리 내지는 중심적인 방법론을 소개하면서 풀어나가는 듯하다.


그걸 염두에 두면, 내 경우에는 통계역학에서 말하는 '평형'이라는 게 무엇인지, 현대적 포말리즘에서 수식적으로 어떻게 다루어지는지부터 꽤 많은 비중을 할애해서 다루면서 시작하면 좋을 듯하다. 이걸 튼튼하게 수립해 둬야, 조건 하나씩 빼 가면서 어떤 종류의 비평형이 나오는지 깊게 살펴보는 게 가능하다.


그리고 그 과정에서 나로서는 약간 옛것 느낌이 드는 macroscopic한 열역학, 그리고 microscopic한 시스템에 대한 linear response theory까지 필연적으로 건드리게 될 듯. 어차피 현대적인 포말리즘 안에서 놀 거라면 그런것들을 안 해도 개별적인 계산 진행에는 문제가 없으나, 지금 내가 하는게 왜 나온 것인지, 어떤 현대적인 개념과 옛 개념이 과연 서로 같은것인지 다른것인지 등등 깊은 이해와 설명을 하기는 어려움.


암튼 이런 걸 왜 목표삼게 되었냐면... 일단 평형을 다룰 때 여러 논문들에서 정의나 전제조건 같은 것들이 조금씩 다 다른데, 그것들 사이의 관계 및 논리적 위계를 통합적으로 다루면서 정리해주는 문헌은 흔히 보기는 어렵다. 그럼에도 사실 많지 않은 수의 논문들을 인용하면서 금세 정리할 수 있다. 이건 단순히 테크니컬한게 아니라, 어떻게 깨지냐에 따라 아예 다른 열역학을 주기 때문에 매우 중요하다.


그리고 정의와 전제를 공유하는 동일한 포말리즘인데도 불구하고 겉보기에 좀 다른 랭귀지로 쓰여있는 경우 (transition probability 기반일지, 혹은 probability current 기반일지 등등)도 있다. 그것들 사이에는 명시적인 계산을 통해 반드시 서로 링크를 지어줄수 있는데, 그걸 직접 보여주는 계산들을 수록하는 것 역시 꽤 유익하지 싶다. 딱 하나의 간단한 계산을 통해 bridge를 제공해주기만 해도 읽는 사람 입장에서 답답함이 사라지고 많은게 명쾌해지는데, 의외로 그런 bridge들이 잘 없음.


페이스북에도 종종 썼듯이 novel한 결과가 아닌 일상적인 계산들도 허투루 버리지 말고 꼭 정리해서 남겨두자고 결심했었는데, 그 이유는 사실은 심심함(...)에 가까웠다. 그러나 훨씬 실질적인 목적을 찾자면 바로 이런 것인 듯. 원래 저렇게 마음먹은 것은 짧지않은 학위과정에서 어떻게든 데일리한 성취감 찾으려고 그런거였는데, 학위논문의 완성도를 높이기 위해서라고 생각하면 매우 실질적인 목적이 생기는거니까.


암튼 그래서 읽는이가 내 학위논문 하나만 옆에 끼고 읽더라도, 평형과 그 깨짐을 다룸에 있어서 미묘하게 달라서 헷갈리는 여러 픽쳐들 사이의 논리적 관계에 대해 명확한 그림을 얻을 수 있게끔 하는게 목표이다. 여기에 더해서, 너무 수학으로 가지 말고 철저히 물리로 설명할수 있으면 더 좋은 물리학 학위논문일 것이다. 애초에 수학을 잘 모르는데 수학 정리들 인용해서 풀어나가는 게 약간 무책임하기도 하고 말이다 (그래도 수학과에서 우리쪽과 관련된 수리물리 연구 하시는 분들이 쓴 문헌들 보면 많은 도움은 될 듯).


그러고 보니 학부 때 물리과 졸업논문 주제를 스스로 정하고 percolation 모형 및 거기서 쓰이는 finite-size scaling 등 통계역학의 일반 기법에 대해 공부할 때에도, 이런 쪽으로 긍정적인 경험이 있었다. 여러 저널 논문들에서 서로 조금씩 다르거나 부분적인 얘기만을 하고 있어서 헷갈리던 것을, 당시 논문지도교수셨던 강병남 교수님 연구실에서 나온 학위논문들(조영설 교수님, 오수민 박사님)을 옆에 끼고 읽으면서 좀 더 잘 이해했었으니 말이다. 내 학위논문도 누군가에게 그런 역할을 한다면 좋지 않을까.


물론 내 관심 주제는 (1) 이런식의 이론 확률열역학 그 자체랑, (2) 그것의 능동물질(active matter)에의 적용 그 사이 어딘가에 아슬아슬하게 있기 때문에, 이런 기획은 얼마든지 엎어질 수도 있다. 만약 학위 연구 과정에서 후자가 많이 강조되게 된다면, 이런 얘기를 깊게 다룰 만한 여유는 없겠지.


지금으로선 (1), (2) 둘다 재밌긴 하고, 양쪽 다 균형있게 다뤄서 어디로든 갈수 있게 리스크 관리를 하고 싶은 마음이다. 근데 후자의 경우에도 실제 세상에의 직접적 유용성 쪽보다는, 평형 모형에는 없는 새로운 현상이 나타나는 이론적 모형이라는 측면에 일차적인 관심이 있는 거라서, 냉정하게 보면 전자 쪽에 가까운 관점으로 공부 중인 듯하다. 교수님께서도 내가 꼼꼼하다 보니 전자 쪽으로도 잘 할수 있을거라고 하셨었다.


근데 다 떠나서 선배 연구자들의 박사학위 논문 보면 이런 작업이 이미 많이 돼있을수도 있다 =_= (근데 내가 이런걸 하려고 참고하고 있는 논문들 중엔 총 인용수 30회 이하의 논문도 많다보니... 아마 그렇지는 않을듯) 결국 일반 저널 논문들뿐 아니라 학위논문들도 많이 읽어보면서 감을 더 잡을 수 있을 듯하다. 물론 이런 것에 대한 집착적인 고민을 하기 이전에, 연구 관련된 고민들부터 평소에 열심히 잘해야함은 물론이다.


Facebook에서 이 글 보기: 링크

Wednesday, July 27, 2022

NEST meeting 발표 후기 (220722)

 지난 금요일에는 약 1년만에 NEST 미팅에서 발표를 했다 (발표자료: 아래에 임베드). 지난번과 달리 zoom이 아닌 오프라인 현장에서 발표했는데, 현장에는 고등과학원 선생님들만 오셔서 옹기종기 진행을 했지만 줌으로는 좀더 많은 분들이 들으신 모양이다. 비록 informal한 시간이지만 통계물리 분야 교수님들, 박사님들께서 한 줄 한 줄 봐주시기 때문에 준비도 무척 디테일하게 하게 되고, 발표 과정에서의 디스커션도 다른 어느 발표보다도 알차게 도움이 된다.


나는 저번 발표(블로그 게시물 링크)에서처럼 이번에도 thermodynamic geometry (이하 TG. 합의된 약어는 아니며 임의로 줄인 것임) 쪽 논문을 리뷰하는 식으로 진행했다. 시스템의 거시적 상태를 정의하는 파라미터 (온도, 압력 등) 쌍들의 모임이, 그 곡률이 명확한 역학적/에너지적 의미를 갖게끔 어떤 다양체를 이룬다는 것이 TG의 핵심적인 관찰이다.


원래 이쪽 분야는 Ruppeiner geometry, Weinhold geometry 등의 이름으로 평형 시스템의 거시적 열역학에 대해 먼저 수립되었고, 액체-기체 상전이나 이징 모형과 같은 교과서적 모형에 대한 기하적 재해석뿐 아니라 블랙홀 등에 대한 최신 연구들에도 꽤나 활발히 적용이 되었다. 다만 상전이에서 나타나는 불연속점이나 미분불가능점 같은 singularity에 대해, 이론 물리학의 자랑할 만한 방법론으로서 잘 정립된 재규격화군(RG) 등에 비해서 이런 TG가 얼마나 좋은 설명력과 새로운 시야를 제공할지는 의문인 상태다.


단적으로 말해 TG는 이미 잘 알고 있는 열역학적 현상을 매니폴드 위에서 일어나는 걸로 취급할수 있더라 라는 재밌는 해석 그 이상도 이하도 아닐 수도 있다. 그러나 이하에서도 서술하겠지만 그러한 재밌는 포말리즘이 연구자를 매혹시키고 계속 공부를 하게끔 한다. 분포가 오직 거시적 파라미터에 의해 간단히 결정되기 때문에 이들 시스템의 기하학은 피셔 정보량을 메트릭 삼는 정보기하(information geometry)와 동등하기도 하다.


아무튼 그러다가 비평형 현상에 대한 구체적인 접근을 가능하게 하는 확률열역학이 발달되면서, 평형으로 relax되고 싶어하지만 외부 제어입력 때문에 계속 평형에서 조금 떨어진 채로 evolve되는, 요동이 중요하게 작용하는 계들을 선형근사해서 TG로 다루는 연구들이 진행되었다. 이미 잘 정립되어 있는 linear response theory (LRT) 가 여기에서 적극적으로 쓰여, 물리문제를 어떠한 기하문제로 바꾸고 어떻게 풀어나가야 하는지 잘 guide를 해준다.


시스템을 제어해서 처음 상태에서 다른 상태로 옮기는 작업을 어떻게 하면 적은 비용으로 수행할 수 있을까? 이런 궁금증은 꽤나 응용가능성이 많은 연구문제다. TG에 따르면 그런 에너지적 비용이, 매우 자연스럽게 파라미터 다양체 상에서의 '길이'와 직접 관련지어 써진다.


멀리 옮길수록 비용이 많이 들테니 당연한 거 아니냐고 할 수도 있는데, TG의 message는 그것보다는 약간 더 nontrivial하다. 목표로 하는 처음 상태와 나중상태가 정해져 있더라도, 어느 경로를 거쳐서 가는지를 여전히 무한히 다양하게 고를 수 있기 때문이다. 다양체가 시스템의 역학적 정보를 담고 있다는 것을 알면, 어떤 경로를 거쳐야 마찰 등에 의한 에너지적 비용 발생을 최소화하면서 목표를 달성할 수 있는지 알 수 있다. 말하자면 매우 추상적으로 정의된 휘어진 공간 상에서 길이를 최소로 하는 '직진'이 무엇인지 알려주는 게 TG의 핵심적 역할이다. 이 경우에 길이를 정해주는 메트릭 텐서는 정보기하와는 약간은 다르게 된다.


더 나아가서, 같은 경로를 따르더라도 어느 부분에서 빠르게 가고 어느 부분에서 느리게 가느냐에 따라 에너지적 비용이 달라질 수 있다. 비록 LRT 영역이라 어차피 매우 느린 상황이긴 하지만, 그 안에서도 이러한 time-parametrization의 이슈는 어느정도 다뤄질 수 있다. 어떤 고정된 경로에 대해 코시-슈바르츠 방정식을 적용하면, (대충 대각화시켜서 얘기하자면) 메트릭텐서의 역할을 하는 susceptibility의 크기가 클수록 그 곳에서는 느리게 움직여야 한다는, 어찌 보면 꽤나 직관적인 결론이 나오기도 한다.


이번에 NEST 미팅에서 소개한 논문은 이러한 TG의 방법론을, (Thouless가 처음 보고한) adiabatic pumping이라는 문제에 대해 적용한다. Adiabatic pumping은 거시적, 항시적 기울기가 없는 상황에서도 싸이클을 돌려서 일정한 방향의 흐름을 만들어내는 것이다. 여기서 흐르는 것은 전기가 될수도 있고 스핀이 될수도 있는 등 다양하다. 저자들은 열역학 연구자들이므로 주로 역학적 에너지를 뽑아내는 엔진에 대해서 다룬다. 특정한 방식의 엔진싸이클은 adiabatic pumping으로 간주될수 있기 때문이다. 이로써 따로 노는 것처럼 보였던 adiabatic pumping 분야와 열역학적 제어 분야가, 기하학이라는 징검다리를 통해 연결된다. 그리고 효율이 높으려면 그만큼 일률(power)는 줄어들어야 한다는 tradeoff relation이 기하로부터 주어지게 된다.


청중 선생님들의 공통된 지적은, 포말리즘이 무척 재밌기는 한데 과연 얼마나 새로운 시야를 제공하는지에 대한 의문이었다. 해당분야 연구자들이 좀더 와닿게 밝혀줘야 할 부분이다. 개인적으로는 매우 scarce한 상황에서 제어를 통해 어렵게 어렵게 에너지를 뽑아낼때는 어떤 경로를 얼마나 빠른속도로 거칠지의 이슈가 중요해지고, 그럴 때 TG가 기존에 우리가 몰랐던 실용적인 솔루션을 제공할수 있지 않을까 상상해보고 있다. 그래도 확실히 재밌긴 한것같고, interest가 잘 맞는 것 같으니 함께 꾸준히 공부 해보자고 말씀해 주셨다.


한편, 아예 평형으로 relax될 생각이 없이 항시적(housekeeping)으로 평형에서 많이 떨어져 있는, arbitrarily far-from-equilibrium 시스템에 대해 TG를 적용하는 연구는 아직 별로 없는 상태다. 왜냐면 LRT만 해도 평형계에서부터 미소하게만 떨어진 것이므로 거시적 파라미터 셋으로 규정되는 앙상블 접근이 약간은 통하는데, 평형에서 임의로 멀리 떨어진 시스템은 앙상블 접근 자체가 잘 통하지 않기 때문이다. 거시적 조건 하에서 비평형계가 어떤 상태를 택할지에 대한 일반원리는 아직 정립되지 않은 상태로, 최소 엔트로피 원리, 최대 엔트로피 원리, 최대 캘리버 원리 등 여러 설들이 부분적인 이해만을 제공하고있다.


Active matter를 비롯한 내가 정말로 관심있는 시스템들도 대부분 이 경우인데, 여기에의 TG 적용은 아직 블루오션이라고 볼 수도 있겠고, 한편으로는 위와 같은 이유로 근본적으로 TG와 안 맞는다고 볼수도 있다. 물론 far-from-equilibrium에서의 엔트로피 생성을 기하적으로 다루는 연구 흐름들도 있고 그것들에도 관심이 무척 많긴 하나, 그건 파라미터들의 공간이 아니라 좀더 추상적인 함수공간이므로 TG와는 아예 다르다.


Active matter를 제어해서 에너지를 뽑아내거나 구조를 형성시킬 때 비용이 어떻게 드는지에 관해서는, 정적인 상태에서의 연구는 나름 진행이 되고 있지만 동역학적 과정에 대한 연구는 거의 없다시피한 상태다. 그 돌파구는 위에서 말한것처럼 함수공간 상에서 엔트로피 생성을 보는 쪽이나, 아니면 optimal transport theory 및 speed limit 쪽에서 활발히 나올 가능성이 높다고 보고있긴 하며, 그쪽에도 흥미가 많이 있다. 그렇지만 그것들에 대한 지식이 TG로도 어느정도 증진된다면 그 역시 꽤나 재밌지 않을까 상상해본다.





Facebook에서 이 글 보기: 링크

Thursday, June 23, 2022

Damped harmonic oscillator coupled with thermal reservoir: frequency-domain approach

확률미분방정식을 time domain에서 정직하게 풀게 되면 상관함수(correlation function)들에서 있어 마땅한 causal structure의 origin이 매우 명쾌하게 보인다는 장점이 있다. 그러나 이렇게 푸는 것은 변수가 세네 개 정도만 있더라도 매우 복잡한 작업이 된다. 특히 변수들 간에 명확한 hierarchy가 있지 않고 서로 영향을 주며 얽혀 있는 경우에는 더욱 그렇다.


따라서 미분방정식을 적절히 다른 domain으로 보내주는 변환을 하여 기술하는 경우가 많다. 라플라스 변환을 해서 \(s\)-domain에서 보는 경우는 상관함수들의 시간에 따른 decay를 보기에 매우 편리해지고, 푸리에 변환을 해서 frequency domain에서 보는 경우는 신호의 스펙트럼 성질, 즉 주파수 대역에 관한 성질을 자연스럽게 볼 수 있다. 이러한 장단점들 외에도, 계산 자체가 time domain에서 보는 것보다 훨씬 간단하다.


이 글에서는 기초적인 물리 시스템인 감쇠 진동자가 열저장체에 접촉하고 평형을 이루고 있어 온도가 잘 정의된 상황을, 주로 푸리에변환을 해서 다룬다. 이는 평형 및 비평형 통계역학의 좋은 연습문제가 된다.


여기에 더해서, 현재 내가 진행중인 연구에서 평형 모델을 구성할때 사용하는 핵심적인 방법론을 이 모델에 적용해 보았다. 그 핵심 방법론이란 주어진 어떤 해밀토니안 \(\mathcal{H}\)에 대해 볼츠만분포 \(e^{-\beta\mathcal{H}}\)를 평형분포로 갖는 확률미분방정식을 결정하는 절차인데, 이 방법에 따르면 쉽게 guess될 수 있는 해밀토니안으로부터 원래의 미분방정식이 유도된다. 따라서 그것이 해당 시스템의 canonical ensemble에 해당하는 해밀토니안이라는 점이, statistics에서 evident할 뿐만 아니라 dynamics의 관점에서 정확하게 입증된다.


본래 연구실 내에서 공유하고자 정리한 문서인데 블로그에도 게시해본다.


Facebook에서 이 글 보기: 링크




Thursday, June 16, 2022

최무영 교수님의 비평형통계역학 특강 TA를 담당한 소감

교양과학서적 <최무영 교수의 물리학 강의>를 중학교 때 인상깊게 읽고 자기소개서에도 쓰고 그랬었는데, 10년쯤 지나서 이번 학기에 최 교수님의 '응집물질물리특강 1 (비평형통계역학)' 수업조교를 맡아서 하게 되었다.


교수님께서는 학생들 과제물을 일일이 살펴보신 뒤에 조교에게 채점하게끔 주시는데, 이번에 마지막 과제 받으러 찾아뵐때 책을 가져가서 싸인을 받아도 되는지 여쭈었고 흔쾌히 허락해 주셨다. 몇번 개정이 되고 표지도 바뀌어서 이제는 아마 구하기 힘든 판본일게다.


당시 내가 구입할 때 아버지도 같이 사 읽으셨어서, 싸인 받는다고 하니까 같이 갖고 가서 받아오게끔 부탁하셨다. 아버지는 이과 전공은 아니지만 수학도 내게 고등학생 초반까지 한 수 가르쳐 주셨을 정도로 워낙 잘하시고 했다보니 이런 과학쪽에도 기본적으로 관심이 있으시고, 당시에 내가 물리학 관심있어 한다니까 함께 읽어보고 이야기 나눠보고 싶어서 사 읽으셨던 것 같다.


다른 물리학자 교수님들과 최교수님이 공저하신 신간 <그렇게 물리학자가 되었다>도 마침 오늘(!) 출간이 되었다. 그래서 그것도 교보에서 사서 가지고 가려 했지만 아쉽게도 우리 학교 교보에는 아직 입고가 안 되었더라. 자서전 느낌인 것 같은데 어떤 내용이 담겨 있을지 궁금하다.


수업 얘기를 좀 해 보자면, 인문대 수업에서는 현실 정치사회에 대한 튀는 말씀도 꽤 자주 하신다고 하는데 (그러한 내용들이 종종 등장하는 <최무영 교수의 물리학 강의> 또한 요즘으로 따지면 '인문사회계를 위한 물리학'에 해당하는 수업에서 강의하셨던 걸 다듬은 것으로 알고 있다) 여기서는 박사과정 특강 수업이다 보니 철저히 전공내용 위주로 진행을 하셨다.


그래도 가끔씩 수업 내용과 관련해서 과학지식의 인식론적 기초, 사회구성적 성격 같은것에 대해 말씀을 해 주시는데 교수님의 견해만을 바탕으로 단정적으로 얘기하기보다는 해당 학계의 여러가지 설을 소개해주시는 식으로, 지극히 합리적인 견해 형성 방식을 갖고 계시다고 느꼈다.


특히 미시적인 대상들과 규칙들의 동역학이 실재에 가깝고 통계역학은 그것들로부터 유도될수 있어야 하는 부차적인 것이라는 물리학도 특유의 환원주의적 도식이, 반드시 맞는건 아닐 수 있다는 말씀도 재밌었다. 우리는 현상의 설명에 가장 유용한 이론적 틀을 골라서 적용하는 것일 뿐이고, 단단한 실재라고 믿어지는 것들도 마찬가지인 것.


이건 내가 시스템의 미시적 디테일이 irrelevant해지고 '근본적으로 거시적인' strict한 법칙들이 등장하는 universality class 같은 걸 보면서 했던 생각들과도 그 결이 비슷했다. 여하튼 소박한 환원주의에 대한 그런 의심은 언뜻 들으면 다소 신비주의적인 계기를 갖는 것으로 오해될수 있으며 한때 '신과학' 등의 구호 하에 지나칠 정도의 총체성에의 추구로 물리학자들을 이끌기도 했지만, 최 교수님은 한때 유행했던 그런 것들과 어느 정도는 거리를 두신 걸로 알고 있고, 해당 언급 역시 철저히 인식론적 문제의식이라고 생각된다.


뭐 모두 중요한 얘기들이지만 사실 여담들이고, 전공 내용 자체에 대한 최 교수님의 강의 실력 또한 두말할필요 없이 명불허전이셨다. 학기 중후반부에는 진도 때문에 너무 급하게 진행했는데 이것이 상당히 아쉽다.


물리 교수님들의 강의 방식을 내 마음대로 두 가지로 나눠 보자면 대단히 심오하고 미묘해보이게 설명하는 방식과, 최대한 클리어하고 담백하게 해설해서 아우라를 부수는 방식이 있다. 들어본 수업 중에는 김석 교수님이 대표적으로 후자 쪽이었다. 최 교수님 수업의 경우 관점은 기본적으로 전자에 가까우신 것 같은데, 그 미묘한 것들조차 단순히 말로 하는게 아니라 정확한 이론적 statement들로 풀어내셔서 오히려 후자에 가깝게 느껴지는 탁월한 강의였다.


이번학기를 끝으로 퇴임하시는 것으로 알고 있는데 명예교수 되시고 나서도 기회가 되면 강의를 열어주시면 좋을 듯하다.


Facebook에서 이 글 보기: 링크