Skip to main content

Scaling deep learning for materials discovery

· 6 min read
Amil Merchant
Google DeepMind 연구원
Simon Batzner
Samuel S. Schoenholz
Muratahan Aykol

논문 정보

  • 제목: Scaling deep learning for materials discovery
  • 저자: Amil Merchant (Google DeepMind), Simon Batzner (Google DeepMind), Samuel S. Schoenholz (Google DeepMind), Muratahan Aykol (Google Research), Gowoon Cheon (Google Research), Ekin Dogus Cubuk (Google DeepMind)
  • 학회/저널: Nature
  • 발행일: 2023-11-29
  • DOI: 10.1038/s41586-023-06735-9
  • 주요 연구 내용: 본 연구는 그래프 신경망(GNN)을 대규모로 확장하고 액티브 러닝을 적용하여 무기 결정의 안정성을 정확하게 예측하는 GNOME(Graph Networks for Materials Exploration) 프레임워크를 개발했다. 이 프레임워크는 대칭성을 고려한 부분 치환(SAPS)과 같은 새로운 후보군 생성 방법과 밀도 범함수 이론(DFT) 계산을 결합한 반복적인 학습 사이클을 통해 모델을 지속적으로 개선하며 방대한 화학 공간을 효율적으로 탐색함.
  • 주요 결과 및 결론: GNOME을 통해 기존 연구 대비 220만 개의 새로운 안정적인 결정 구조를 발견했으며, 이 중 381,000개는 새로운 볼록 껍질(convex hull)을 형성하여 인류에게 알려진 안정적인 재료의 수를 10배 가까이 확장함. 최종 모델은 에너지 예측 오차를 원자당 11 meV까지 낮췄으며, 안정적인 구조 예측의 정확도(hit rate)를 80% 이상으로 향상시킴. 또한, 이 과정에서 생성된 방대한 데이터셋은 전이 학습 없이도 높은 정확도를 보이는 범용 머신러닝 원자간 전위(MLIP) 모델 개발을 가능하게 함.
  • 기여점: 알려진 안정적인 무기 재료의 수를 10배 가까이 확장하여 재료 과학 분야에 방대한 데이터를 제공함. 딥러닝 모델의 규모를 확장함으로써 학습 데이터 분포를 벗어나는 문제(out-of-distribution)에 대한 일반화 성능이 향상될 수 있음을 보여주었고, 이는 과학적 발견에서 머신러닝의 근본적인 한계를 극복할 가능성을 제시함. 또한, 생성된 데이터셋을 통해 특정 재료에 대한 추가 학습 없이도 분자 동역학 시뮬레이션에 바로 사용될 수 있는 고성능 사전 학습 원자간 전위 모델을 개발함.

Explainable AI for Material Property Prediction Based on Energy Cloud: A Shapley-Driven Approach

· 5 min read
Faiza Qayyum
Murad Ali Khan
Do-Hyeun Kim
Hyunseok Ko
Ga-Ae Ryu

논문 정보

  • 제목: Explainable AI for Material Property Prediction Based on Energy Cloud: A Shapley-Driven Approach
  • 저자: Faiza Qayyum (Jeju National University), Murad Ali Khan (Jeju National University), Do-Hyeun Kim (Jeju National University), Hyunseok Ko (Korea Institute of Ceramic Engineering and Technology), Ga-Ae Ryu (Korea Institute of Ceramic Engineering and Technology)
  • 학회/저널: Materials
  • 발행일: 2023-11-24
  • DOI: 10.3390/ma16237322
  • 주요 연구 내용: TabNet 딥러닝 프레임워크를 활용하여 PZT(납 지르콘산 티탄산염) 세라믹의 조성 및 공정 데이터를 기반으로 유전율 특성을 예측하는 모델을 개발함. 모델의 예측 결과를 해석하고 입력 변수와 예측 사이의 관계를 이해하기 위해 설명가능 AI(XAI) 기법인 SHAP(Shapley additive explanations) 분석을 수행함.
  • 주요 결과 및 결론: 제안된 TabNet 모델은 기존 머신러닝 모델(XGBoost, Bi-Layered ANN)보다 우수한 성능을 보였으며, 평균 제곱 오차(MSE) 0.047, 평균 절대 오차(MAE) 0.042를 달성함. SHAP 분석을 통해 압전상수(d33), 유전 손실(tangent loss), 화학식이 유전율 예측에 중요한 기여를 하는 반면, 공정 시간은 상대적으로 영향이 적음을 확인함.
  • 기여점: PZT 세라믹 특성 예측을 위해 특화된 새로운 TabNet 기반 딥러닝 프레임워크를 개발함. SHAP 분석을 통해 모델의 예측에 대한 해석 가능성을 높이고, 다양한 입력 파라미터가 예측에 미치는 영향을 심층적으로 분석하여 압전 재료 특성 예측 분야의 신뢰성을 향상시킴.

Experimental-based statistical models for the tensile characterization of synthetic fiber ropes: a machine learning approach

· 6 min read
Yahia Halabi
Hu Xu
Zhixiang Yu
Wael Alhaddad
Isabelle Dreier

논문 정보

  • 제목: Experimental-based statistical models for the tensile characterization of synthetic fiber ropes: a machine learning approach
  • 저자: Yahia Halabi (Southwest Jiaotong University), Hu Xu (Southwest Jiaotong University), Zhixiang Yu (Southwest Jiaotong University), Wael Alhaddad (Tongji University), Isabelle Dreier (University of Giessen)
  • 학회/저널: Scientific Reports
  • 발행일: 2023-10-18
  • DOI: 10.1038/s41598-023-44816-x
  • 주요 연구 내용: 폴리에스터, 폴리프로필렌, 나일론 로프에 대해 DSC 열분석, 섬유/얀 인장 실험, 196개의 로프 인장 실험을 수행하여 포괄적인 데이터베이스를 구축함. 이 데이터를 기반으로 로프의 3선형(tri-linear) 응력-변형률 프로파일을 예측하는 인공신경망(ANN) 모델을 개발하고 최적화함.
  • 주요 결과 및 결론: 개발된 ANN 모델은 파단 강도 및 변형률에 대해 약 5%의 오차로 로프의 3선형 응력-변형률 특성을 정확하게 예측함. 이 연구는 로프의 공정-구조-물성 관계에 대한 이해를 높이고, 인장 특성 설계 및 예측에 드는 비용과 노력을 줄이는 데 기여함.
  • 기여점: 합성 섬유 로프의 인장 특성에 대한 광범위한 실험적 통계 데이터를 체계적으로 구축함. 기계 학습(ANN)을 적용하여 복잡한 비선형적 인장 거동을 실용적인 3선형 모델로 예측하는 방법을 제시했으며, 이는 산업 현장에서의 로프 설계 및 성능 예측에 직접적으로 활용될 수 있음.

The emergent role of explainable artificial intelligence in the materials sciences

· 5 min read
Tommy Liu
Australian National University 연구원
Amanda S. Barnard

논문 정보

  • 제목: The emergent role of explainable artificial intelligence in the materials sciences
  • 저자: Tommy Liu (School of Computing, Australian National University), Amanda S. Barnard (School of Computing, Australian National University)
  • 학회/저널: Cell Reports Physical Science
  • 발행일: 2023-10-18
  • DOI: 10.1016/j.xcrp.2023.101630
  • 주요 연구 내용: 본 논문은 설명가능 인공지능(XAI)의 현황을 검토하고, 재료 정보학 워크플로우를 보강할 수 있는 도구로서 XAI 방법론(내재적, 사후, 데이터-프로세스)을 분류하여 제시함. 특히 재료 과학 분야에서 활용되는 복잡한 블랙박스 모델을 해석하기 위해 모델에 구애받지 않는 사후 분석 기법인 SHAP(Shapley additive explanations)의 중요성을 강조함.
  • 주요 결과 및 결론: XAI는 재료 과학에서 머신러닝 예측을 실제 전략으로 전환하는 데 있어 신뢰성 구축, 인과관계 이해에 필수적임. 특히 섀플리 값(Shapley values)과 같은 XAI 기법의 도입은 모델을 개선하고, 실험 설계를 안내하며, 머신러닝 예측에 기반한 투자 결정을 정당화함으로써 재료 발견을 가속화할 수 있음.
  • 기여점: 재료 과학자들을 위한 XAI 활용 실용 가이드를 제공하며 물리 과학 분야와 가장 관련성이 높은 방법들을 조명함. 복잡한 머신러닝 예측과 과학적 이해 사이의 간극을 메우고, 재료 정보학에서 모델 검증과 과학적 방법의 가속화에 있어 XAI의 역할을 제시함.

섬유의 변퇴색 기준 판정 내광성 등급 기반 이상치 처리 기법

· 4 min read
이대규
경북대학교 컴퓨터학부 석사과정생
서강복
경북대학교 컴퓨터학부 박사
김덕엽
경북대학교 컴퓨터학부 박사과정생
이우진
경북대학교 컴퓨터학부 전임교수

논문 정보

  • 제목: 섬유의 변퇴색 기준 판정 내광성 등급 기반 이상치 처리 기법 (Outlier Processing Techniques Based on Colorfastness Rating Determination Based on Change in Color of Textile)
  • 저자: 이대규, 서강복, 김덕엽, 이우진 (경북대학교 IT대학 컴퓨터학부)
  • 학회/저널: 2023 한국컴퓨터종합학술대회
  • 발행일: 2023-06-21
  • DOI: 제공되지 않음
  • 주요 연구 내용: 본 연구는 섬유 염색 공정 데이터에서 내광성 등급 예측 모델의 성능을 향상시키기 위한 이상치 처리 기법을 제안함. 제안된 기법은 기기으로 측정한 변퇴색(ΔEF\Delta E_F) 기반의 내광성 등급과 현장에서 수집된 내광성 등급을 비교해 두 등급 간의 차이가 특정 임계값을 초과하는 데이터를 이상치로 간주하고 제거하는 방식임.
  • 주요 결과 및 결론: 수집된 내광성 등급과 변퇴색 기준 등급 간의 차이가 1.5를 초과하는 데이터를 이상치로 제거했을 때, 예측 모델의 정확도가 0.94953으로 가장 높게 나타남. 이는 원본 데이터(0.86301)나 일반적인 이상치 처리 기법(Z-score: 0.91359, IQR: 0.87477)을 적용했을 때보다 우수한 성능임.
  • 기여점: 노동집약적인 섬유 산업 분야의 데이터가 갖는 비정규 분포 특성을 고려한 도메인 특화 이상치 처리 기법을 제안함. 이를 통해 데이터의 신뢰성을 높이고 머신러닝 모델의 예측 정확도를 향상시켜, 제품 생산 효율성 증대에 기여할 수 있는 실용적인 방법론을 제시함.

Systematically Producing Test Orders to Detect Order-Dependent Flaky Tests

· 6 min read
Chengpeng Li
M. Mahdi Khosravi
Wing Lam
August Shi

논문 정보

  • 제목: Systematically Producing Test Orders to Detect Order-Dependent Flaky Tests
  • 저자: Chengpeng Li (The University of Texas at Austin), M. Mahdi Khosravi (Middle East Technical University), Wing Lam (George Mason University), August Shi (The University of Texas at Austin)
  • 학회/저널: Proceedings of the 32nd ACM SIGSOFT International Symposium on Software Testing and Analysis (ISSTA '23)
  • 발행일: 2023-05-03 (Accepted date)
  • DOI: https://doi.org/10.1145/3597926.3598083
  • 주요 연구 내용: 기존의 무작위 순서 변경이나 테스트 '클래스' 단위 페어링의 한계를 극복하기 위해, Tuscan squares를 활용하여 테스트 '메서드' 단위의 페어를 체계적으로 생성하는 세 가지 기법 (Tuscan Intra-Class, Tuscan Inter-Class, Target Pairs)을 제안함. 이 기법들은 테스트 클래스 내 페어(intra-class)와 클래스 간 페어(cross-class)를 커버함.
  • 주요 결과 및 결론: 47개 프로젝트의 289개 OD 테스트 평가 결과, 'Tuscan Intra-Class' 기법이 평균 104.7개의 테스트 순서로 97.2%의 OD 테스트를 탐지하여, 기존 기법(36.0% 탐지) 대비 비용 대비 효율성이 가장 높았음. 'Tuscan Inter-Class'는 100% 탐지하지만 비용이 매우 높았음.
  • 기여점: (1) 테스트 페어를 체계적으로 커버하는 세 가지 새로운 OD 테스트 탐지 기법 제안. (2) 289개 OD 테스트에 대한 평가를 통해 'Tuscan Intra-Class'가 가장 비용 효율적임을 입증. (3) 실제 OD 탐지에 필요한 최소 순서 집합이 매우 작음을 보여(평균 < 4), 향후 테스트 순서 우선순위화 연구의 필요성을 제시함.

Generating Real-Time, Selective, and Multimodal Haptic Effects from Sound for Gaming Experience Enhancement

· 7 min read
Gyeore Yun
POSTECH 연구원
Seungmoon Choi
POSTECH 교수

논문 정보

  • 제목 (Title): Generating Real-Time, Selective, and Multimodal Haptic Effects from Sound for Gaming Experience Enhancement
  • 저자 (Authors) 및 소속 (Affiliations):
    • 윤겨레 (Pohang University of Science and Technology)
    • 문민재 (Pohang University of Science and Technology)
    • 이준근 (Pohang University of Science and Technology)
    • 김동근 (Pohang University of Science and Technology)
    • Hong Z. Tan (Google LLC)
    • 최승문 (Pohang University of Science and Technology)
  • 학회 또는 저널명 (Conference or Journal Name): Proceedings of the 2023 CHI Conference on Human Factors in Computing Systems (CHI '23)
  • 제출일 또는 발행일 (Submission or Publication Date): 2023년 4월 23-28일
  • 키워드 (Keywords): 사운드-햅틱 변환, 오디오-햅틱 변환, 다중 모드 햅틱 효과, 자동 생성, 게임
  • 초록 (Abstract): 본 논문은 사운드 신호를 실시간으로 처리하여 진동, 충격, 또는 진동과 충격이 결합된 햅틱 효과를 생성하는 알고리즘을 제안한다. 제안하는 알고리즘은 전문가가 레이블링한 데이터셋으로 구축된 머신러닝 분류기(랜덤 포레스트)를 사용하여 사운드에 가장 적합한 유형의 햅틱 효과를 매칭한다는 점에서 '선택적'이다. 이 알고리즘은 비디오 게임 플레이 경험을 향상시키기 위해 맞춤화되었으며, RPG와 FPS 장르에 대한 두 가지 예시를 제시한다. 동일한 교차 모달 변환을 위한 다른 최신 기술(SOTA) 방법들과 비교하는 사용자 연구를 통해 알고리즘의 효과를 입증했으며, 두 게임 장르 모두에서 SOTA 알고리즘보다 더 나은 다중감각 사용자 경험을 이끌어냈다.
  • 주요 연구 내용 (Main Research Content/Methodology):
    • 실시간 사운드-햅틱 변환 시스템 제안: 게임의 오디오 스트림을 실시간으로 캡처하고 처리하여 진동, 충격, 또는 이 둘을 결합한 다중 모드 햅틱 효과를 생성한다.
    • 머신러닝 기반 선택적 분류: 전문가가 RPG 및 FPS 게임 사운드에 대해 레이블링한 데이터셋을 구축하고, 이를 기반으로 학습된 랜덤 포레스트(Random Forest) 분류기를 사용하여 사운드에 가장 적합한 햅틱 유형(없음, 진동, 충격, 복합)을 실시간으로 선택한다.
    • 다중 모드 햅틱 렌더링: 분류된 햅틱 유형에 따라 진동 액추에이터(Vibrotactile Actuator)와 충격 액추에이터(Impact Actuator)를 제어하여 풍부하고 다양한 햅틱 피드백을 사용자에게 제공한다.
    • 실시간 성능 최적화: 사용자가 사운드와 햅틱을 동시에 인지할 수 있도록, 데이터 캡처 윈도우 크기와 분류 모델 파라미터를 최적화하여 전체 계산 지연 시간을 최소화했다(사운드-충격 평균 63.3ms).
    • 사용자 경험 평가: 기존의 대표적인 사운드-햅틱 변환 알고리즘(단순 저역 통과 필터, 심리음향학 기반 SOTA)과 제안된 알고리즘(진동만, 다중 모드)을 RPG 및 FPS 게임 영상에 적용하여 사용자 경험을 비교 평가했다.
  • 주요 결과 및 결론 (Key Findings and Conclusion):
    • 제안 시스템의 우수성 입증: 제안된 ML 기반 시스템은 적절성, 방해 정도, 즐거움, 동기화, 피로도, 선호도 등 대부분의 사용자 경험 지표에서 기존 SOTA 알고리즘들보다 통계적으로 유의미하게 우수한 평가를 받았다.
    • 선택적 변환의 효과: 배경음악과 같은 불필요한 사운드까지 햅틱으로 변환하는 단순 필터링 방식에 비해, 제안된 시스템처럼 중요한 이벤트 사운드만 '선택적으로' 변환하는 것이 사용자의 방해와 피로감을 크게 줄이고 전반적인 경험을 향상시켰다.
    • ML 분류기의 견고성: 제안된 랜덤 포레스트 분류기(98.7% 정확도)는 단순 임계값에 의존하는 심리음향학적 SOTA 방법에 비해 다양한 사운드 환경(e.g., 배경음악 볼륨이 큰 경우)에서도 더 일관되고 안정적으로 목표 사운드를 감지하여 햅틱 효과를 생성했다.
    • 다중 모드 햅틱의 잠재성: 진동만 사용한 경우와 진동+충격을 함께 사용한 경우 간에 통계적으로 유의미한 선호도 차이는 없었다. 인터뷰 결과, 충격 효과가 현실감과 몰입감을 높인다는 긍정적 의견과, 과도하거나 피곤하다는 부정적 의견이 공존하여 개인 선호도 차이가 큰 것으로 나타났다.
  • 기여점 (Contributions):
    • 최초의 다중 모드 선택적 사운드-햅틱 변환 시스템: 게임 사운드로부터 실시간으로 작동하며, 머신러닝을 기반으로 '선택적'으로 햅틱 효과를 생성하는 최초의 '다중 모드(진동+충격)' 사운드-햅틱 변환 알고리즘과 시스템을 제안했다.
    • 사용자 경험 향상의 실험적 검증: 사용자 연구를 통해 제안된 접근 방식이 기존의 단순 변환 방식이나 심리음향학 기반의 SOTA 방법에 비해 게임 경험을 유의미하게 향상시킨다는 것을 실험적으로 검증했다.
    • 실시간 성능과 정확도의 균형 달성: 실시간 성능(낮은 지연 시간)과 높은 분류 정확도를 동시에 달성하기 위한 시스템 파라미터 최적화 과정을 제시했다.
  • DOI (Digital Object Identifier): 10.1145/3544548.3580787
  • 기타 식별 가능한 정보:
    • 연구 분야: 인간-컴퓨터 상호작용(HCI), 햅틱스, 게임
    • 연구 대상: 비디오 게임 (RPG, FPS)
    • 데이터셋: 유튜브 게임플레이 영상에서 사운드 샘플을 수집하여 전문가 레이블링을 통해 자체 데이터셋 구축

Robot Behavior-Tree-Based Task Generation with Large Language Models

· 5 min read
Yue Cao
C.S. George Lee

논문 정보

  • 제목: Robot Behavior-Tree-Based Task Generation with Large Language Models
  • 저자: Yue Cao, C.S. George Lee (Purdue University)
  • 학회/저널: arXiv (Preprint), AAAI-MAKE 2023 Proceedings
  • 발행일: 2023-02-24
  • DOI: -
  • 주요 연구 내용: 사전 학습된 대규모 언어 모델(LLM)을 활용하여 로봇 작업을 위한 행동 트리(Behavior Tree)를 생성하는 방법을 제안한다. 3계층 구조 생성을 위한 'Phase-Step 프롬프트'와 지식 기반(Knowledge Base)에서 유사한 작업을 검색하여 프롬프트를 구성하는 자동화 파이프라인을 제시한다.
  • 주요 결과 및 결론: 제안된 방법은 GPT-3 및 ChatGPT를 통해 다양한 도메인의 작업(예: 컴퓨터 조립)을 생성하는 데 성공했다. 특히 Phase-Step 프롬프트를 사용했을 때 단순 프롬프트 대비 행동 트리의 구조적 모듈성을 훨씬 잘 유지함을 확인했다.
  • 기여점: LLM을 행동 트리 생성에 적용한 최초의 시도로, 고정된 기본 작업(primitive tasks) 집합에 얽매이지 않고 새로운 도메인의 로봇 작업을 생성할 수 있는 일반화된 방법을 제시했다.

요약

초록

행동 트리(Behavior Tree)는 모듈성과 재사용성 덕분에 로봇 작업 표현 방식으로 인기를 얻고 있다. 그러나 수동으로 행동 트리를 설계하는 것은 시간이 많이 소요되며, 기존의 자동 생성 방식은 고정된 기본 작업(primitive tasks)에 의존하여 새로운 도메인으로의 확장이 어렵다. 본 논문은 최신 대규모 언어 모델(LLM)을 활용한 새로운 행동 트리 기반 작업 생성 접근 방식을 제안한다. 계층적 구조 생성을 가능하게 하는 'Phase-Step 프롬프트'를 설계하고, 행동 트리 임베딩 기반 검색을 통합하여 적절한 프롬프트를 자동으로 설정한다. 이를 통해 사전 정의된 기본 작업 집합 없이도 추상적인 작업 설명만으로 행동 트리를 신속하게 생성할 수 있음을 보여준다.

서론

행동 트리는 로봇 작업을 제어 흐름 노드(control-flow nodes)를 사용하여 조정하는 그래픽 표현 방식으로, 상태 머신(state machine) 등에 비해 모듈성과 가독성이 뛰어나다. 기존 연구들은 LTL 사양이나 PDDL 플래너를 통해 행동 트리를 생성하려 했으나, 이는 사전에 정의된 도메인 내의 작업 라이브러리에 의존한다는 한계가 있었다. 본 연구는 GPT-3와 같은 LLM의 강력한 일반화 능력을 활용하여 이러한 한계를 극복하고자 한다. 로봇 작업 생성 문제를 프롬프트 기반 학습 패러다임으로 재정의하고, 순차적 작업(sequential tasks) 생성을 넘어 모듈화된 행동 트리 구조를 생성하는 것을 목표로 한다.

배경

행동 트리는 Directed Rooted Tree 형태로 정의되며, 실행을 담당하는 리프 노드(Action, Condition)와 제어 흐름을 담당하는 브랜치 노드(Sequence, Fallback 등)로 구성된다. LLM 분야에서는 소수 샷(few-shot) 학습 능력을 활용한 '프롬프트 기반 학습'이 대두되었다. 본 연구는 입력 텍스트를 템플릿화하여 LLM이 기존 지식을 바탕으로 원하는 구조의 출력을 생성하도록 유도한다.

모델 아키텍처 / 방법론

Figure 3 1. Phase-Step 프롬프트 (Phase-Step Prompt) 3계층 행동 트리(Root → Phase → Step)를 생성하기 위한 프롬프트 설계다. Figure 3에서 보여지는 구조를 텍스트 형태로 변환하여 입력한다. 'Source Task'에 예시 작업 절차를 Phase와 Step으로 구분하여 제공하고, 'Target Task'에 원하는 작업 설명을 입력하여 LLM이 동일한 구조로 출력을 생성하도록 유도한다.

2. 행동 트리 구성 (Behavior-Tree Construction) 생성된 3계층 구조의 하위 작업(sub-task)들이 로봇이 수행 가능한 기본 동작(primitive)인지 확인하고 확장하는 과정이다.

  • 동사 유사도 측정: 로봇의 기본 동사 목록 LL과 하위 작업의 동사 vv 간의 유사도를 측정한다. 이를 위해 언어 임베딩 모델 Enc1()Enc_1()을 사용하여 다음과 같은 각도-코사인 유사도(angular-cosine similarity)를 계산한다. Sim(v,Li)=12arccos(Enc1(v)Enc1(Li)Enc1(v)Enc1(Li))πSim(v, L_i) = 1 - \frac{2 \arccos(\frac{Enc_1(v) \cdot Enc_1(L_i)}{\|Enc_1(v)\| \|Enc_1(L_i)\|})}{\pi} 유사도가 임계값 미만일 경우, 해당 하위 작업을 다시 LLM에 입력하여 더 세분화된 트리로 확장(Decomposition)한다.
  • 예외 처리: "안정성을 위해(for stability)"와 같은 추가 사양이 있는 경우, Fallback 노드와 Condition 노드를 삽입하여 구조를 보강한다. Figure 4 3. 자동 소스 작업 선택 (Automatic Source-Task Selection) 프롬프트에 사용할 가장 적절한 'Source Task'를 지식 기반(Knowledge Base)에서 자동으로 검색한다.
  • 행동 트리 임베딩: 타겟 작업 설명(vtargetv_{target})과 지식 기반 내의 행동 트리들(uiu_i) 간의 유사도를 계산하여 가장 유사한 트리를 템플릿으로 선택한다. Sim(target,BTi)=vtargetuivtargetuiSim(target, BT_i) = \frac{v_{target} \cdot u_i}{\|v_{target}\| \|u_i\|}
  • 전체 파이프라인은 논문의 Figure 4에 도식화되어 있으며, 타겟 설명 → 유사 소스 검색 → 프롬프트 구성 → LLM 생성 → 행동 트리 완성의 흐름을 따른다.

실험 결과

1. 실험 설정 GPT-3 (text-davinci-003)와 ChatGPT를 사용하여 실험을 진행했다. 자동차 휠 조립 작업을 소스 작업으로 사용하여 "데스크탑 조립"이라는 타겟 작업을 생성하는 과정을 시연했다. Figure 5 2. 전체 프로세스 시연

  • Table 3와 Figure 5에 따르면, GPT-3는 4개 페이즈 11개 스텝의 구조적인 작업을 생성했으며, ChatGPT는 3개 페이즈 8개 스텝을 생성했다.
  • 동사 유사도 검사 결과, ChatGPT가 생성한 "install" 동사는 로봇의 기본 동작이 아니라고 판단되어, 이를 다시 1개의 페이즈로 분해하는 과정(Table 4)을 거쳐 구체적인 동작(pick, place 등)으로 변환했다.

3. 절제 연구 (Ablation Study) Phase-Step 프롬프트의 효과를 검증하기 위해 구조화되지 않은 일반 프롬프트(PS-none)와 비교했다.

  • 구조 비율(Structure Ratio, R): 트리의 균형을 측정하기 위해 R=Nmin/NmaxR = N_{min}/N_{max} (두 번째 레이어의 최소 자식 노드 수 / 최대 자식 노드 수)라는 지표를 정의했다.
  • 결과: Table 6에 따르면, PS-none 프롬프트는 RR 값이 0에 가까워 순차적(sequential) 작업에 가까웠으나, Phase-Step 프롬프트는 RR 값이 0.6 이상으로 소스 작업의 트리 구조를 잘 보존했다.

4. 조립 작업 평가 부품 결합(part-mating) 작업의 수를 지표(NmateN_{mate})로 사용하여 평가했다. 더 상세한 소스 프롬프트(PS-desktop)를 사용했을 때 생성된 결과물에도 더 많은 결합 작업이 포함되어, 프롬프트의 상세도가 생성된 작업의 품질에 영향을 미침을 확인했다.

결론

본 연구는 생성형 AI 기술을 로봇 공학의 행동 트리 설계에 접목하여, 엔드 유저의 작업 설계 부담을 줄이고 도메인 간 작업 전이를 가능하게 했다. 생성된 작업이 합리적이고 실행 가능해 보이지만, 복잡한 공장 환경이나 엄격한 안전 규정을 작업 생성 과정에 어떻게 통합할지는 향후 과제로 남아있다. 또한, LLM이 학습 데이터에 없는 매우 희귀한 작업(예: 빈스 롬바르디 트로피 제작)이나 특정 로봇 하드웨어(Atlas 로봇)의 세부 사항을 처리하는 데에는 한계가 있음을 확인했다.

데이터 불균형과 측정 오차를 고려한 생분해성 섬유 인장 강신도 예측 모델 개발

· 5 min read
Se-Chan Park
김덕엽
경북대학교 컴퓨터학부 박사과정생
서강복
경북대학교 컴퓨터학부 박사
이우진
경북대학교 컴퓨터학부 전임교수

논문 정보

  • 제목: The Development of Biodegradable Fiber Tensile Tenacity and Elongation Prediction Model Considering Data Imbalance and Measurement Error
  • 저자: 박세찬, 김덕엽, 서강복, 이우진 (경북대학교 컴퓨터학부)
  • 학회/저널: KIPS Transactions on Software and Data Engineering (정보처리학회논문지/소프트웨어 및 데이터 공학)
  • 발행일: 2022-12-01
  • DOI: 10.3745/KTSDE.2022.11.12.489
  • 주요 연구 내용: 섬유 방사 공정 데이터의 특성(적은 양, 불균형, 샘플 간 오차)을 고려하여, 동일 방사 조건 클러스터 내 평균과의 거리를 기준으로 이상치를 처리하는 기법을 제안함. 또한, 여러 공정 변수와 예측 물성 간 상관계수 및 데이터 불균형 정도를 종합적으로 고려한 복합 데이터 증강 기법을 제안함.
  • 주요 결과 및 결론: 제안한 이상치 처리 및 데이터 증강 기법을 적용했을 때, 기존 기법들(박스 플롯, CBLOF, ROS, SMOTE)보다 데이터 손실이 적고 불균형을 효과적으로 완화함. MLP 모델 기준, 인장 강도 예측에서 평균절대오차(MAE)는 약 27% 감소하고 조정된 결정계수(R2R^2)는 0.5 미만에서 약 0.8 수준으로 크게 개선됨.
  • 기여점: 데이터 수집이 어려운 섬유 산업에서 발생하는 데이터 부족, 불균형, 측정 오차 문제를 해결하기 위한 맞춤형 데이터 전처리 기법을 제안함. 이를 통해 AI 예측 모델의 성능과 신뢰도를 향상시켜 공정 비용 절감 및 품질 최적화에 기여할 수 있는 실용적 방안을 제시.

Deep learning-based fabric defect detection: A review

· 5 min read
Yavuz Kahraman
Adiyaman University 연구원
Alptekin Durmuşoğlu

논문 정보

  • 제목: Deep learning-based fabric defect detection: A review
  • 저자: Yavuz Kahraman (Adiyaman University), Alptekin Durmuşoğlu (Gaziantep University)
  • 학회/저널: Textile Research Journal
  • 발행일: 2022-10-17
  • DOI: 10.1177/00405175221130773
  • 주요 연구 내용: 2003년부터 현재까지 발표된 딥러닝 기반 직물 결함 검출 관련 논문 38개를 체계적으로 검토하고 분류함. 연구들은 주로 합성곱 신경망(CNN), 생성적 적대 신경망(GAN), 오토인코더(Autoencoder), 순환 신경망(LSTM)과 같은 주요 딥러닝 아키텍처를 기반으로 분석되었음.
  • 주요 결과 및 결론: 딥러닝, 특히 CNN 기반 방법론이 직물 결함 검출에서 95% 이상의 높은 성공률을 보이며 매우 효과적임을 확인함. 가장 많이 활용된 공개 데이터셋은 TILDA였으나, 연구의 일반화와 재현성을 위해 표준화된 대규모 데이터베이스 구축의 필요성을 제기함.
  • 기여점: 본 논문은 딥러닝 기반 직물 결함 검출 분야를 전문적으로 다룬 최초의 최신 리뷰 연구임. 주요 딥러닝 아키텍처의 장단점을 비교 분석하고, 사용된 데이터셋과 성능을 종합적으로 정리하여 해당 분야 연구자들에게 유용한 참고 자료와 향후 연구 방향을 제시함.