Skip to main content

23 posts tagged with "Machine learning"

머신러닝 - 데이터로부터 패턴을 학습하여 예측과 의사결정을 수행하는 기술

View All Tags

Scaling deep learning for materials discovery

· 6 min read
Amil Merchant
Google DeepMind 연구원
Simon Batzner
Samuel S. Schoenholz
Muratahan Aykol

논문 정보

  • 제목: Scaling deep learning for materials discovery
  • 저자: Amil Merchant (Google DeepMind), Simon Batzner (Google DeepMind), Samuel S. Schoenholz (Google DeepMind), Muratahan Aykol (Google Research), Gowoon Cheon (Google Research), Ekin Dogus Cubuk (Google DeepMind)
  • 학회/저널: Nature
  • 발행일: 2023-11-29
  • DOI: 10.1038/s41586-023-06735-9
  • 주요 연구 내용: 본 연구는 그래프 신경망(GNN)을 대규모로 확장하고 액티브 러닝을 적용하여 무기 결정의 안정성을 정확하게 예측하는 GNOME(Graph Networks for Materials Exploration) 프레임워크를 개발했다. 이 프레임워크는 대칭성을 고려한 부분 치환(SAPS)과 같은 새로운 후보군 생성 방법과 밀도 범함수 이론(DFT) 계산을 결합한 반복적인 학습 사이클을 통해 모델을 지속적으로 개선하며 방대한 화학 공간을 효율적으로 탐색함.
  • 주요 결과 및 결론: GNOME을 통해 기존 연구 대비 220만 개의 새로운 안정적인 결정 구조를 발견했으며, 이 중 381,000개는 새로운 볼록 껍질(convex hull)을 형성하여 인류에게 알려진 안정적인 재료의 수를 10배 가까이 확장함. 최종 모델은 에너지 예측 오차를 원자당 11 meV까지 낮췄으며, 안정적인 구조 예측의 정확도(hit rate)를 80% 이상으로 향상시킴. 또한, 이 과정에서 생성된 방대한 데이터셋은 전이 학습 없이도 높은 정확도를 보이는 범용 머신러닝 원자간 전위(MLIP) 모델 개발을 가능하게 함.
  • 기여점: 알려진 안정적인 무기 재료의 수를 10배 가까이 확장하여 재료 과학 분야에 방대한 데이터를 제공함. 딥러닝 모델의 규모를 확장함으로써 학습 데이터 분포를 벗어나는 문제(out-of-distribution)에 대한 일반화 성능이 향상될 수 있음을 보여주었고, 이는 과학적 발견에서 머신러닝의 근본적인 한계를 극복할 가능성을 제시함. 또한, 생성된 데이터셋을 통해 특정 재료에 대한 추가 학습 없이도 분자 동역학 시뮬레이션에 바로 사용될 수 있는 고성능 사전 학습 원자간 전위 모델을 개발함.

Explainable AI for Material Property Prediction Based on Energy Cloud: A Shapley-Driven Approach

· 5 min read
Faiza Qayyum
Murad Ali Khan
Do-Hyeun Kim
Hyunseok Ko
Ga-Ae Ryu

논문 정보

  • 제목: Explainable AI for Material Property Prediction Based on Energy Cloud: A Shapley-Driven Approach
  • 저자: Faiza Qayyum (Jeju National University), Murad Ali Khan (Jeju National University), Do-Hyeun Kim (Jeju National University), Hyunseok Ko (Korea Institute of Ceramic Engineering and Technology), Ga-Ae Ryu (Korea Institute of Ceramic Engineering and Technology)
  • 학회/저널: Materials
  • 발행일: 2023-11-24
  • DOI: 10.3390/ma16237322
  • 주요 연구 내용: TabNet 딥러닝 프레임워크를 활용하여 PZT(납 지르콘산 티탄산염) 세라믹의 조성 및 공정 데이터를 기반으로 유전율 특성을 예측하는 모델을 개발함. 모델의 예측 결과를 해석하고 입력 변수와 예측 사이의 관계를 이해하기 위해 설명가능 AI(XAI) 기법인 SHAP(Shapley additive explanations) 분석을 수행함.
  • 주요 결과 및 결론: 제안된 TabNet 모델은 기존 머신러닝 모델(XGBoost, Bi-Layered ANN)보다 우수한 성능을 보였으며, 평균 제곱 오차(MSE) 0.047, 평균 절대 오차(MAE) 0.042를 달성함. SHAP 분석을 통해 압전상수(d33), 유전 손실(tangent loss), 화학식이 유전율 예측에 중요한 기여를 하는 반면, 공정 시간은 상대적으로 영향이 적음을 확인함.
  • 기여점: PZT 세라믹 특성 예측을 위해 특화된 새로운 TabNet 기반 딥러닝 프레임워크를 개발함. SHAP 분석을 통해 모델의 예측에 대한 해석 가능성을 높이고, 다양한 입력 파라미터가 예측에 미치는 영향을 심층적으로 분석하여 압전 재료 특성 예측 분야의 신뢰성을 향상시킴.

Experimental-based statistical models for the tensile characterization of synthetic fiber ropes: a machine learning approach

· 6 min read
Yahia Halabi
Hu Xu
Zhixiang Yu
Wael Alhaddad
Isabelle Dreier

논문 정보

  • 제목: Experimental-based statistical models for the tensile characterization of synthetic fiber ropes: a machine learning approach
  • 저자: Yahia Halabi (Southwest Jiaotong University), Hu Xu (Southwest Jiaotong University), Zhixiang Yu (Southwest Jiaotong University), Wael Alhaddad (Tongji University), Isabelle Dreier (University of Giessen)
  • 학회/저널: Scientific Reports
  • 발행일: 2023-10-18
  • DOI: 10.1038/s41598-023-44816-x
  • 주요 연구 내용: 폴리에스터, 폴리프로필렌, 나일론 로프에 대해 DSC 열분석, 섬유/얀 인장 실험, 196개의 로프 인장 실험을 수행하여 포괄적인 데이터베이스를 구축함. 이 데이터를 기반으로 로프의 3선형(tri-linear) 응력-변형률 프로파일을 예측하는 인공신경망(ANN) 모델을 개발하고 최적화함.
  • 주요 결과 및 결론: 개발된 ANN 모델은 파단 강도 및 변형률에 대해 약 5%의 오차로 로프의 3선형 응력-변형률 특성을 정확하게 예측함. 이 연구는 로프의 공정-구조-물성 관계에 대한 이해를 높이고, 인장 특성 설계 및 예측에 드는 비용과 노력을 줄이는 데 기여함.
  • 기여점: 합성 섬유 로프의 인장 특성에 대한 광범위한 실험적 통계 데이터를 체계적으로 구축함. 기계 학습(ANN)을 적용하여 복잡한 비선형적 인장 거동을 실용적인 3선형 모델로 예측하는 방법을 제시했으며, 이는 산업 현장에서의 로프 설계 및 성능 예측에 직접적으로 활용될 수 있음.

The emergent role of explainable artificial intelligence in the materials sciences

· 5 min read
Tommy Liu
Australian National University 연구원
Amanda S. Barnard

논문 정보

  • 제목: The emergent role of explainable artificial intelligence in the materials sciences
  • 저자: Tommy Liu (School of Computing, Australian National University), Amanda S. Barnard (School of Computing, Australian National University)
  • 학회/저널: Cell Reports Physical Science
  • 발행일: 2023-10-18
  • DOI: 10.1016/j.xcrp.2023.101630
  • 주요 연구 내용: 본 논문은 설명가능 인공지능(XAI)의 현황을 검토하고, 재료 정보학 워크플로우를 보강할 수 있는 도구로서 XAI 방법론(내재적, 사후, 데이터-프로세스)을 분류하여 제시함. 특히 재료 과학 분야에서 활용되는 복잡한 블랙박스 모델을 해석하기 위해 모델에 구애받지 않는 사후 분석 기법인 SHAP(Shapley additive explanations)의 중요성을 강조함.
  • 주요 결과 및 결론: XAI는 재료 과학에서 머신러닝 예측을 실제 전략으로 전환하는 데 있어 신뢰성 구축, 인과관계 이해에 필수적임. 특히 섀플리 값(Shapley values)과 같은 XAI 기법의 도입은 모델을 개선하고, 실험 설계를 안내하며, 머신러닝 예측에 기반한 투자 결정을 정당화함으로써 재료 발견을 가속화할 수 있음.
  • 기여점: 재료 과학자들을 위한 XAI 활용 실용 가이드를 제공하며 물리 과학 분야와 가장 관련성이 높은 방법들을 조명함. 복잡한 머신러닝 예측과 과학적 이해 사이의 간극을 메우고, 재료 정보학에서 모델 검증과 과학적 방법의 가속화에 있어 XAI의 역할을 제시함.

Generating Real-Time, Selective, and Multimodal Haptic Effects from Sound for Gaming Experience Enhancement

· 7 min read
Gyeore Yun
POSTECH 연구원
Seungmoon Choi
POSTECH 교수

논문 정보

  • 제목 (Title): Generating Real-Time, Selective, and Multimodal Haptic Effects from Sound for Gaming Experience Enhancement
  • 저자 (Authors) 및 소속 (Affiliations):
    • 윤겨레 (Pohang University of Science and Technology)
    • 문민재 (Pohang University of Science and Technology)
    • 이준근 (Pohang University of Science and Technology)
    • 김동근 (Pohang University of Science and Technology)
    • Hong Z. Tan (Google LLC)
    • 최승문 (Pohang University of Science and Technology)
  • 학회 또는 저널명 (Conference or Journal Name): Proceedings of the 2023 CHI Conference on Human Factors in Computing Systems (CHI '23)
  • 제출일 또는 발행일 (Submission or Publication Date): 2023년 4월 23-28일
  • 키워드 (Keywords): 사운드-햅틱 변환, 오디오-햅틱 변환, 다중 모드 햅틱 효과, 자동 생성, 게임
  • 초록 (Abstract): 본 논문은 사운드 신호를 실시간으로 처리하여 진동, 충격, 또는 진동과 충격이 결합된 햅틱 효과를 생성하는 알고리즘을 제안한다. 제안하는 알고리즘은 전문가가 레이블링한 데이터셋으로 구축된 머신러닝 분류기(랜덤 포레스트)를 사용하여 사운드에 가장 적합한 유형의 햅틱 효과를 매칭한다는 점에서 '선택적'이다. 이 알고리즘은 비디오 게임 플레이 경험을 향상시키기 위해 맞춤화되었으며, RPG와 FPS 장르에 대한 두 가지 예시를 제시한다. 동일한 교차 모달 변환을 위한 다른 최신 기술(SOTA) 방법들과 비교하는 사용자 연구를 통해 알고리즘의 효과를 입증했으며, 두 게임 장르 모두에서 SOTA 알고리즘보다 더 나은 다중감각 사용자 경험을 이끌어냈다.
  • 주요 연구 내용 (Main Research Content/Methodology):
    • 실시간 사운드-햅틱 변환 시스템 제안: 게임의 오디오 스트림을 실시간으로 캡처하고 처리하여 진동, 충격, 또는 이 둘을 결합한 다중 모드 햅틱 효과를 생성한다.
    • 머신러닝 기반 선택적 분류: 전문가가 RPG 및 FPS 게임 사운드에 대해 레이블링한 데이터셋을 구축하고, 이를 기반으로 학습된 랜덤 포레스트(Random Forest) 분류기를 사용하여 사운드에 가장 적합한 햅틱 유형(없음, 진동, 충격, 복합)을 실시간으로 선택한다.
    • 다중 모드 햅틱 렌더링: 분류된 햅틱 유형에 따라 진동 액추에이터(Vibrotactile Actuator)와 충격 액추에이터(Impact Actuator)를 제어하여 풍부하고 다양한 햅틱 피드백을 사용자에게 제공한다.
    • 실시간 성능 최적화: 사용자가 사운드와 햅틱을 동시에 인지할 수 있도록, 데이터 캡처 윈도우 크기와 분류 모델 파라미터를 최적화하여 전체 계산 지연 시간을 최소화했다(사운드-충격 평균 63.3ms).
    • 사용자 경험 평가: 기존의 대표적인 사운드-햅틱 변환 알고리즘(단순 저역 통과 필터, 심리음향학 기반 SOTA)과 제안된 알고리즘(진동만, 다중 모드)을 RPG 및 FPS 게임 영상에 적용하여 사용자 경험을 비교 평가했다.
  • 주요 결과 및 결론 (Key Findings and Conclusion):
    • 제안 시스템의 우수성 입증: 제안된 ML 기반 시스템은 적절성, 방해 정도, 즐거움, 동기화, 피로도, 선호도 등 대부분의 사용자 경험 지표에서 기존 SOTA 알고리즘들보다 통계적으로 유의미하게 우수한 평가를 받았다.
    • 선택적 변환의 효과: 배경음악과 같은 불필요한 사운드까지 햅틱으로 변환하는 단순 필터링 방식에 비해, 제안된 시스템처럼 중요한 이벤트 사운드만 '선택적으로' 변환하는 것이 사용자의 방해와 피로감을 크게 줄이고 전반적인 경험을 향상시켰다.
    • ML 분류기의 견고성: 제안된 랜덤 포레스트 분류기(98.7% 정확도)는 단순 임계값에 의존하는 심리음향학적 SOTA 방법에 비해 다양한 사운드 환경(e.g., 배경음악 볼륨이 큰 경우)에서도 더 일관되고 안정적으로 목표 사운드를 감지하여 햅틱 효과를 생성했다.
    • 다중 모드 햅틱의 잠재성: 진동만 사용한 경우와 진동+충격을 함께 사용한 경우 간에 통계적으로 유의미한 선호도 차이는 없었다. 인터뷰 결과, 충격 효과가 현실감과 몰입감을 높인다는 긍정적 의견과, 과도하거나 피곤하다는 부정적 의견이 공존하여 개인 선호도 차이가 큰 것으로 나타났다.
  • 기여점 (Contributions):
    • 최초의 다중 모드 선택적 사운드-햅틱 변환 시스템: 게임 사운드로부터 실시간으로 작동하며, 머신러닝을 기반으로 '선택적'으로 햅틱 효과를 생성하는 최초의 '다중 모드(진동+충격)' 사운드-햅틱 변환 알고리즘과 시스템을 제안했다.
    • 사용자 경험 향상의 실험적 검증: 사용자 연구를 통해 제안된 접근 방식이 기존의 단순 변환 방식이나 심리음향학 기반의 SOTA 방법에 비해 게임 경험을 유의미하게 향상시킨다는 것을 실험적으로 검증했다.
    • 실시간 성능과 정확도의 균형 달성: 실시간 성능(낮은 지연 시간)과 높은 분류 정확도를 동시에 달성하기 위한 시스템 파라미터 최적화 과정을 제시했다.
  • DOI (Digital Object Identifier): 10.1145/3544548.3580787
  • 기타 식별 가능한 정보:
    • 연구 분야: 인간-컴퓨터 상호작용(HCI), 햅틱스, 게임
    • 연구 대상: 비디오 게임 (RPG, FPS)
    • 데이터셋: 유튜브 게임플레이 영상에서 사운드 샘플을 수집하여 전문가 레이블링을 통해 자체 데이터셋 구축

Explainable machine learning in materials science

· 6 min read
Xiaoting Zhong
Brian Gallagher
Shusen Liu
Bhavya Kailkhura
Anna Hiszpanski
T. Yong-Jin Han

논문 정보

  • 제목: Explainable machine learning in materials science
  • 저자: Xiaoting Zhong, Brian Gallagher, Shusen Liu, Bhavya Kailkhura, Anna Hiszpanski, T. Yong-Jin Han (Lawrence Livermore National Laboratory)
  • 학회/저널: npj Computational Materials
  • 발행일: 2022-09-22
  • DOI: 10.1038/s41524-022-00884-7
  • 주요 연구 내용: 재료과학 분야에서 높은 정확도를 가진 머신러닝 모델의 블랙박스 문제를 해결하기 위한 설명 가능 인공지능(XAI)의 개념과 기술을 소개함. 모델 처리 과정(후처리)과 모델 설계(선행) 측면에서 DNN을 설명하는 다양한 방법을 분류하고, 실제 재료과학 응용 사례를 검토함.
  • 주요 결과 및 결론: 재료과학 연구에서 XAI 기술, 특히 히트맵과 같은 시각화 기법이 모델 예측을 신뢰하고, 모델의 오류 원인을 진단하며, 새로운 과학적 가설을 생성하는 데 효과적임을 보여줌. 또한, XAI가 아직 초기 단계이며 재료과학 데이터의 명확한 정답(ground truth) 부족, 설명 평가의 어려움 등 해결해야 할 과제가 많음을 지적함.
  • 기여점: 재료과학 분야 연구자들에게 XAI에 대한 입문서 역할을 제공하며, 예측 정확도뿐만 아니라 설명 가능성을 원하는 이들에게 유용한 개념적 틀과 실제 적용 사례를 제시함. 논문은 XAI 기술의 유용성을 강조하는 동시에, 무분별한 해석을 피하고 적절한 평가의 필요성을 역설함.

Quality Prediction and Abnormal Processing Parameter Identification in Polypropylene Fiber Melt Spinning Using Artificial Intelligence Machine Learning and Deep Learning Algorithms

· 5 min read
Amit Kumar Gope
Yu-Shu Liao
Chung-Feng Jeffrey Kuo

논문 정보

  • 제목: Quality Prediction and Abnormal Processing Parameter Identification in Polypropylene Fiber Melt Spinning Using Artificial Intelligence Machine Learning and Deep Learning Algorithms
  • 저자: Amit Kumar Gope, Yu-Shu Liao, Chung-Feng Jeffrey Kuo (National Taiwan University of Science and Technology)
  • 학회/저널: Polymers
  • 발행일: 2022-07-04
  • DOI: 10.3390/polym14132739
  • 주요 연구 내용: 딥러닝 신경망을 사용하여 폴리프로필렌(PP) 용융 방사 공정의 다중 품질 특성을 예측하고 최적의 공정 파라미터를 탐색함. 이후, 품질 이상 데이터가 주어졌을 때 랜덤 포레스트를 포함한 여러 머신러닝 및 딥러닝 방법을 비교하여 이상 원인이 되는 공정 파라미터를 식별하는 2단계 진단 시스템을 개발.
  • 주요 결과 및 결론: 랜덤 포레스트 모델이 이상 공정 파라미터 식별에서 가장 우수한 성능을 보임. 단일/이중 요인 식별 정확도 100%, 단일 요인 분류 정확도 98.3%, 이중 요인 분류 정확도 96.0%를 달성하여 제안된 진단 방법의 효과를 입증.
  • 기여점: PP 용융 방사 공정에서 제품 품질 저하의 원인이 되는 공정 파라미터를 신속하고 정확하게 진단하는 인공지능 기반 시스템을 제안함. 이를 통해 기존의 전문가 의존적 분석 시간을 단축하고 공정 제어 안정성을 높여 생산 비용 절감에 기여.

Analysing an imbalanced stroke prediction dataset using machine learning techniques

· 5 min read
Viswapriya Subramaniyam Elangovan
Rajeswari Devarajan
Osamah I. Khalaf
Mhd Saeed Sharif
Wael Elmedany

논문 정보

  • 제목: Analysing an Imbalanced Stroke Prediction Dataset Using Machine Learning Techniques
  • 저자: Viswapriya Subramaniyam Elangovan (SRM Institute of Science and Technology), Rajeswari Devarajan (SRM Institute of Science and Technology), Osamah I. Khalaf (Al-Nahrain University), Mhd Saeed Sharif (UEL University), Wael Elmedany (University of Bahrain)
  • 학회/저널: KIJOMS
  • 발행일: 2022-01-01
  • DOI: DOI 링크 없음
  • 주요 연구 내용: Kaggle의 공개 뇌졸중 예측 데이터셋은 소수 클래스(뇌졸중 환자)가 매우 적은 불균형 문제를 가짐. 이 문제를 해결하기 위해 SMOTE와 Adasyn 같은 오버샘플링 기법을 적용하여 데이터셋의 균형을 맞추고, 제안하는 하이브리드 신경망-랜덤 포레스트(NN-RF) 모델의 성능을 평가함.
  • 주요 결과 및 결론: 제안된 NN-RF 모델은 Adasyn 오버샘플링 기법을 적용했을 때 가장 높은 성능을 보였음. F1-score 75%, 정확도 84%, AUC 86%를 달성하여 다른 벤치마킹 알고리즘(DT, LR, NN, RF)보다 우수한 예측 성능을 입증함.
  • 기여점: 데이터 불균형 문제를 해결하기 위한 오버샘플링 기법의 효과를 검증함. 또한, 기존 단일 모델들의 한계를 극복하기 위해 신경망과 랜덤 포레스트를 결합한 하이브리드 모델을 제안하고 그 우수성을 실험적으로 증명함.

생분해성 섬유 방사 공정 데이터 특성을 고려한 물성 예측 모델 개발

· 4 min read
박세찬
경북대학교 컴퓨터학부 박사
김덕엽
경북대학교 컴퓨터학부 박사과정생
서강복
경북대학교 컴퓨터학부 박사
이우진
경북대학교 컴퓨터학부 전임교수

논문 정보

  • 제목: 생분해성 섬유 방사 공정 데이터 특성을 고려한 물성 예측 모델 개발 (The Development of Property Prediction Model in Consideration of Biodegradable Fiber Spinning Process Data Characteristics)
  • 저자: 박세찬, 김덕엽, 서강복, 이우진 (경북대학교 컴퓨터학부)
  • 학회/저널: ASK 2022 학술발표대회 논문집
  • 발행일: 2022-01-01
  • DOI: 제공되지 않음
  • 주요 연구 내용: 섬유 방사 공정 데이터는 양이 적고 분포가 불균형하며, 동일 조건 샘플 간에도 오차가 존재하는 특성이 있음. 본 논문은 이러한 특성을 반영하여, 물성 단위와 허용오차를 고려한 이상치 처리 기법과 데이터 불균형 정도 및 물성과의 상관성을 고려한 오버샘플링 기법을 제안함.
  • 주요 결과 및 결론: 제안된 데이터 전처리 기법들을 MLP 모델에 적용한 결과, 조정된 결정계수는 0.479에서 0.789로 크게 향상되었고, 평균절대오차는 0.165에서 0.120으로 약 27% 감소함. 이를 통해 모델의 데이터 적합도와 예측 정확성이 크게 개선되었음을 확인함.
  • 기여점: 데이터 확보가 어려운 섬유 방사 공정의 현실적인 문제를 해결하기 위해 도메인 지식(공정관리한계 허용오차)을 활용한 데이터 처리 기법을 제안함. 데이터 불균형과 상관성을 동시에 고려한 오버샘플링을 통해 물성 예측 모델의 성능을 실질적으로 개선하여 AI 기술의 현장 적용 가능성을 높임.

Fabric Defect Classification Using Combination of Deep Learning and Machine Learning

· 3 min read
Semih UTKU
Hakan ÖZDEMİR

논문 정보

  • 제목: Fabric Defect Classification Using Combination of Deep Learning and Machine Learning
  • 저자: Fatma Günseli YAŞAR ÇIKLAÇANDIR (İzmir Katip Çelebi University), Semih UTKU (Dokuz Eylul University), Hakan ÖZDEMİR (Dokuz Eylul University)
  • 학회/저널: Journal of Artificial Intelligence and Data Science (JAIDA)
  • 발행일: 2021-08-12
  • DOI: 제공되지 않음
  • 주요 연구 내용: 딥러닝 모델(ResNet18, GoogLeNet)을 이용한 원단 불량 분류와, 이 모델들에서 특징만 추출하고 분류는 SVM(Support Vector Machines)으로 수행하는 하이브리드 방식의 성능을 비교 분석함. 딥러닝의 단점인 긴 처리 시간을 개선하는 것을 목표로 함.
  • 주요 결과 및 결론: 순수 ResNet18 모델이 가장 높은 분류 정확도(최대 87.5%)를 보였으나, ResNet18로 특징을 추출하고 SVM으로 분류하는 하이브리드 모델은 정확도 저하가 크지 않으면서도 분류 시간을 약 60배 단축시키는 결과를 보임.
  • 기여점: 딥러닝의 높은 특징 추출 능력과 머신러닝 분류기의 속도 이점을 결합하여, 원단 불량 검출 시스템에서 시간 효율성과 정확성 간의 균형을 맞춘 실용적인 접근법을 제시함. 이를 통해 속도가 중요한 실제 생산 환경에 적용 가능한 지능형 시스템의 가능성을 보임.