• Junghwan Park, Kyungjin Rim

Compact Model의 새로운 모습 'Neural Compact Model'

  • 반도체 산업의 발전

자율 주행 자동차, 빅데이터, 그리고 사물 인터넷과 같이 수많은 반도체 제품을 필요로 하는 시장의 수요를 충족시키기 위해, 반도체 제품을 구성하는 트랜지스터는 그림 1과 같이 나노 단위의 작은 크기 그리고 더 높은 성능을 가지는 구조로 발전해 왔습니다.


그림 1. 트랜지스터의 구조 변화 [1]

그 결과, 동일한 면적의 웨이퍼 위에 수 십, 혹은 수 백 억 개에 달하는 트랜지스터를 한곳에 집적할 수 있게 되었고, 수많은 트랜지스터의 집적은 고성능을 요구하는 작업들을 수행할 수 있게 만들었습니다 [2].


  • TCAD와 SPICE 시뮬레이션

생산 비용의 절감 및 제품 생산의 안정성을 보장하기 위해 반도체 제품 제작에 앞서 선행되어야 하는 것이 있습니다. 시뮬레이션을 통해, 단일 트랜지스터의 전기적 구동을 정확하게 모사하고, 여러 트랜지스터로 구성된 회로가 원하는 방향으로 구동하는지 확인하는 과정입니다. TCAD (Technology Computer Aided Design)는 단일 트랜지스터 분석에 최적화된 시뮬레이터로, 제조 단계부터 전기적 특성까지 분석이 가능합니다. 하지만 TCAD에서 사용하는 유한요소해석방법은 계산량이 많기 때문에 [3], 수 억 개의 트랜지스터로 구성된 회로를 분석하기에는 적합하지 않습니다. 이 문제를 해결하기 위해 회로 분석에 최적화된 시뮬레이터 SPICE (Simulation Program with Integrated Circuit Emphasis)를 사용합니다.


  • Compact Model

회로 분석을 위한 SPICE는 트랜지스터의 거동을 수학적으로 표현한 compact model을 사용합니다. Compact model은 수많은 천재 과학자들에 의해 수년간 연구 및 집대성되며, CMC (Compact Model Coalition) 단체에 의해 표준화가 이루어집니다. Numerical 해를 구하는 TCAD와는 달리, SPICE는 compact model로부터 analytic 해를 얻고 회로를 평가하기 때문에 더 적은 계산량으로 분석이 가능합니다. 하지만, 물리적인 이해를 기반으로 유도한 수식 만으로는 소자의 특성을 전체적으로 모사하는 데에 한계가 있습니다. 따라서 물리적 수식에 더해 fitting parameter를 이용해서 TCAD 혹은 측정 데이터에 compact model을 맞추는 과정이 필요합니다. 이를 Model Parameter Extraction (MPE)이라 부르며, MPE가 성공적으로 진행되었다면, 이를 토대로 회로를 디자인하고 공정을 진행합니다.

Compact model의 장점에도 불구하고 여전히 해결해야 할 숙제가 남아있습니다. 수식 또는 fitting parameter로도 표현하지 못한 부분들에 있어 정확도의 한계가 있으며, 앞서 언급한 것처럼 특정 트랜지스터에 해당하는 compact model을 만들기 위해서는 오랜 시간과 노력이 필요하다는 것입니다. 따라서 새로운 구조의 트랜지스터의 회로 분석을 위한 compact model 개발은 또다시 수년간의 시간을 필요로 할 것이며, 개발에 들어가는 엄청난 비용에도 불구하고 그 정확성은 보장하지 못합니다[4].


  • Neural Compact Model (ANN-based Compact Model) 이란?

Neural compact model은 사람이 직접 만들던 수식을 Artificial Neural Network(ANN)를 이용하여 대체하는 방법이며 ANN-based compact model 이라고도 부릅니다. ANN을 이용한 compact model의 개발은 자연스러운 흐름이라고 생각됩니다. 발전된 형태의 트랜지스터 동작을 설명하기 위해 analytic model은 파라미터를 증가시키며 점점 복잡한 수식이 되어가고 있는데(그림 2), 파라미터 중에는 물리적인 의미를 갖지 않고 곡선을 맞추기 위해 임의로 추가하는 것들이 많아졌으며 파라미터를 맞출 때도 AI를 사용하기 시작했기 때문입니다. ANN은 충분한 파라미터를 사용하면 복잡한 데이터라도 짧게는 수 분에서 길게는 수 시간 내로 학습 시킬 수 있어 기존 방법의 최대 단점인 시간이 오래 걸린다는 점을 효과적으로 개선해 줍니다.


그림 2. 시간에 따라 파라미터 숫자가 늘어나는 수식 모델의 흐름 [5]

애플의 M1칩이나 삼성의 엑시노스칩에 아직 FinFET을 사용하고 있는데, 그림 1을 보면 FinFET은 2010년에 상업화된 트랜지스터 입니다. 현재 FinFET 보다 우수한 기술이 나오고 있음에도 불구하고, 새로운 기술에 대한 analytic model 개발은 쉽지 않기 때문에 회로에서의 성능을 정확하게 검증하는 데에 많은 시간이 걸립니다. 하지만 neural compact model을 사용한다면 새로운 트랜지스터를 사용할 수 있는 장벽을 낮출 수 있을 것으로 생각됩니다.


  • Neural Compact Model의 한계와 연구의 필요성

그림 3. 트랜지스터 동작을 설명하기 위한 물리적 특성들 [6]

ANN을 사용한다고 모두 해결되는 것은 아닙니다. 소자 모델은 동작 전압 범위 전체에서의 특성을 모사해야 하는데, 학습에 사용하는 측정 데이터는 일반적으로 동작 전압 범위 일부에 대해서만 제공이 된다는 문제가 있습니다. 트랜지스터의 물리적 특성들을 잘 설명해 주는 모델을 만들기 위해서는 고려해야 할 것들이 많습니다(그림 3). 기존의 수식 모델도 이 특성들을 맞추기 위해서 수식이 복잡해지고 파라미터가 많아졌던 것입니다. 결과적으로는 트랜지스터의 특성을 반영하여 만들었기 때문에 데이터가 적어도 물리적 현상에 위배되지 않아 사용하는 데 문제가 없었습니다. ANN의 interpolation, extrapolation 성능은 학습에 사용하는 데이터의 경향성을 유지할 경우에는 뛰어나지만, 학습한 데이터와 다른 현상을 보이는 영역까지 잘 예측하기는 어렵습니다. 따라서 ANN도 데이터에만 의존하는 것이 아니라 추가적인 지식을 주어 물리적 현상을 잘 설명해 주도록 만들어야 합니다.


이를 위해 알세미에서는 다음과 같은 연구를 진행하고 있습니다.

  1. 물리적 지식을 사용해 neural network에 편향을 부여하는 모델 개발 연구. (physics-based Neural Network)

  2. 기존에 사용되던 트랜지스터 데이터로 물리적 현상에 대한 지식을 학습 시키고 새로운 트랜지스터에 대한 compact model을 만들 때 도움을 주는 연구. (meta-learning, transfer learning, multi-task learning)

  3. 사람이 오랜 시간에 걸쳐 만들어 내던 수식 모델을 AI를 사용해 개발하는 연구. (symbolic regression)

이외에도 loss landscape, bayesian deep learning, model compression 등을 연구하여 제한된 데이터 환경에서 좋은 compact model을 만들어내기 위해 노력하고 있습니다.


 
  • Reference

[1] IMEC’s Plan For Continued Scaling, (IMEC, 2021)

[2] Moore's law: past, present and future (R.R. Schaller, 1997)

[3] Generalized Comprehensive Approach for Robust Three-Dimensional Mesh Generation for TCAD (R. Heinzl, 2005)

[4] Modeling Emerging Technologies using Machine Learning: Challenges and Opportunities (Florian Klemme, 2020)

[5] The efficient DTCO Compact Modeling Solutions to Improve MHC and Reduce TAT, (Y. Kim et al., SISPAD, 2018)

[6] FinFET Modeling for IC Simulation and Design, (Academic Press, 2015)

Recent Posts

See All

현재 미국 전기차 업체 테슬라는 상당한 수준의 자율주행 능력을 보여주는데 그 배경에는 Multitask-learning의 개념이 뒷받침 되어있습니다. 자율주행 자동차는 부착된 카메라를 통해 받아오는 실시간 도로 상황의 이미지를 이용해 사물분류, 차선감지, 표지판 탐색, 그리고 도로 마크인식 등등 여러 문제를 동시에 풀어야 합니다. (Andrej Kapath

지난 십수년 동안, AI 모델은 거대한 양의 데이터로 보다 정확하고 정밀하게 주어진 임무를 수행하는 방향으로 발달해 왔습니다. 지난 수차례 이 블로그에서도 언급된 바와 같이, 빅 데이터로부터 학습된 neural network는 학습 데이터 뿐 아니라 unseen 영역에서도 뛰어난 성능을 보임이 밝혀져 (generalisation) 이에 대한 연구가 활발히

AI는 많은 분야에서 전통적인 알고리즘 보다 월등한 성능을 보여주고 있습니다. 성능이 더 좋아졌다면 바로 현실에 도입할 수 있을까요? 그 판단은 AI를 적용하려는 분야에 따라 달라질 것 같습니다. 스마트폰 음성 인식이나, 넷플릭스 영화 추천 등에서는 기존 95% 정확도가 97%로 올라갔다면 사용하지 않을 이유가 없을 것 입니다. 하지만 의료 영상 분석, 자