본문으로 건너뛰기

Explainable machine learning in materials science

· 약 6분
Xiaoting Zhong
Brian Gallagher
Shusen Liu
Bhavya Kailkhura
Anna Hiszpanski
T. Yong-Jin Han

논문 정보

  • 제목: Explainable machine learning in materials science
  • 저자: Xiaoting Zhong, Brian Gallagher, Shusen Liu, Bhavya Kailkhura, Anna Hiszpanski, T. Yong-Jin Han (Lawrence Livermore National Laboratory)
  • 학회/저널: npj Computational Materials
  • 발행일: 2022-09-22
  • DOI: 10.1038/s41524-022-00884-7
  • 주요 연구 내용: 재료과학 분야에서 높은 정확도를 가진 머신러닝 모델의 블랙박스 문제를 해결하기 위한 설명 가능 인공지능(XAI)의 개념과 기술을 소개함. 모델 처리 과정(후처리)과 모델 설계(선행) 측면에서 DNN을 설명하는 다양한 방법을 분류하고, 실제 재료과학 응용 사례를 검토함.
  • 주요 결과 및 결론: 재료과학 연구에서 XAI 기술, 특히 히트맵과 같은 시각화 기법이 모델 예측을 신뢰하고, 모델의 오류 원인을 진단하며, 새로운 과학적 가설을 생성하는 데 효과적임을 보여줌. 또한, XAI가 아직 초기 단계이며 재료과학 데이터의 명확한 정답(ground truth) 부족, 설명 평가의 어려움 등 해결해야 할 과제가 많음을 지적함.
  • 기여점: 재료과학 분야 연구자들에게 XAI에 대한 입문서 역할을 제공하며, 예측 정확도뿐만 아니라 설명 가능성을 원하는 이들에게 유용한 개념적 틀과 실제 적용 사례를 제시함. 논문은 XAI 기술의 유용성을 강조하는 동시에, 무분별한 해석을 피하고 적절한 평가의 필요성을 역설함.

Transfer Learning with Self-Supervised Vision Transformer for Large-Scale Plant Identification

· 약 4분
Mingle Xu
전북대학교 연구원
Sook Yoon
Yongchae Jeong
Jaesu Lee
Dong Sun Park

논문 정보

  • 제목: Transfer Learning with Self-Supervised Vision Transformer for Large-Scale Plant Identification
  • 저자: Mingle Xu (Jeonbuk National University), Sook Yoon (Mokpo National University), Yongchae Jeong (Jeonbuk National University), Jaesu Lee (Rural Development Administration), Dong Sun Park (Jeonbuk National University)
  • 학회/저널: CLEF 2022
  • 발행일: 2022-09-05
  • DOI: N/A
  • 주요 연구 내용: 대규모 소수샷(few-shot) 식물 식별 챌린지인 PlantCLEF2022를 해결하기 위해, 기존의 지도 학습 방식 CNN 대신 자기 지도 학습으로 사전 학습된 Vision Transformer(ViT) 모델, 구체적으로 Masked Autoencoder (MAE)를 사용함. 이 접근법은 ViT의 높은 모델 용량과 자기 지도 학습의 범용적인 특징 추출 능력을 활용함.
  • 주요 결과 및 결론: 제안된 방법으로 PlantCLEF2022 챌린지에서 MA-MRR 0.62692를 기록하며 1위를 차지함. 추가 학습을 통해 0.64079까지 성능을 향상시켰으며, PlantCLEF2022 데이터셋으로 사전 학습된 모델이 다른 식물 질병 인식 과제에서도 성능 향상에 기여함을 보임.
  • 기여점: 자기 지도 학습 ViT가 대규모, 소수샷 이미지 분류 문제에 효과적임을 입증함. 또한, PlantCLEF2022 데이터셋과 이를 통해 사전 학습된 모델이 식물 관련 하위 과제(downstream task)에 유용한 공개 자원이 될 수 있음을 시사함.

Quality Prediction and Abnormal Processing Parameter Identification in Polypropylene Fiber Melt Spinning Using Artificial Intelligence Machine Learning and Deep Learning Algorithms

· 약 5분
Amit Kumar Gope
Yu-Shu Liao
Chung-Feng Jeffrey Kuo

논문 정보

  • 제목: Quality Prediction and Abnormal Processing Parameter Identification in Polypropylene Fiber Melt Spinning Using Artificial Intelligence Machine Learning and Deep Learning Algorithms
  • 저자: Amit Kumar Gope, Yu-Shu Liao, Chung-Feng Jeffrey Kuo (National Taiwan University of Science and Technology)
  • 학회/저널: Polymers
  • 발행일: 2022-07-04
  • DOI: 10.3390/polym14132739
  • 주요 연구 내용: 딥러닝 신경망을 사용하여 폴리프로필렌(PP) 용융 방사 공정의 다중 품질 특성을 예측하고 최적의 공정 파라미터를 탐색함. 이후, 품질 이상 데이터가 주어졌을 때 랜덤 포레스트를 포함한 여러 머신러닝 및 딥러닝 방법을 비교하여 이상 원인이 되는 공정 파라미터를 식별하는 2단계 진단 시스템을 개발.
  • 주요 결과 및 결론: 랜덤 포레스트 모델이 이상 공정 파라미터 식별에서 가장 우수한 성능을 보임. 단일/이중 요인 식별 정확도 100%, 단일 요인 분류 정확도 98.3%, 이중 요인 분류 정확도 96.0%를 달성하여 제안된 진단 방법의 효과를 입증.
  • 기여점: PP 용융 방사 공정에서 제품 품질 저하의 원인이 되는 공정 파라미터를 신속하고 정확하게 진단하는 인공지능 기반 시스템을 제안함. 이를 통해 기존의 전문가 의존적 분석 시간을 단축하고 공정 제어 안정성을 높여 생산 비용 절감에 기여.

Repairing Order-Dependent Flaky Tests via Test Generation

· 약 7분
Chengpeng Li
Chenguang Zhu
Wenxi Wang
August Shi

논문 정보

  • 제목: Repairing Order-Dependent Flaky Tests via Test Generation
  • 저자: Chengpeng Li, Chenguang Zhu, Wenxi Wang, and August Shi (The University of Texas at Austin)
  • 학회/저널: 2022 IEEE/ACM 44th International Conference on Software Engineering (ICSE)
  • 발행일: 2022-05-21
  • DOI: https://doi.org/10.1145/3510003.3510173
  • 주요 연구 내용: 순서 의존적(order-dependent) 결함 테스트 복구를 위한 자동화 기법 ODRepair 제안. 이 기법은 먼저 테스트 실패를 유발하는 오염된 공유 상태(polluted shared state)를 식별하고, 이후 자동화된 테스트 생성 도구(Randoop)를 활용하여 해당 상태를 리셋(reset)하는 '클리너(cleaner)' 코드(메서드 호출 시퀀스)를 생성함.
  • 주요 결과 및 결론: 327개의 순서 의존적 테스트 대상 평가. ODRepair는 181개 테스트에서 오염된 정적 필드(static field)를 식별했으며, 이 중 141개의 테스트에 대한 패치를 성공적으로 생성함. 기존 SOTA 기법인 iFixFlakies가 복구하지 못하는 24개의 테스트를 ODRepair가 복구함.
  • 기여점:
    1. 기존에 '클리너' 테스트가 없는 경우에도 테스트 생성을 통해 순서 의존적 테스트를 복구하는 새로운 접근법 제시.
    2. 오염된 공유 힙 상태(heap-state), 특히 정적 필드를 자동으로 식별하는 'Debugger' 컴포넌트 개발.
    3. 'Generator' 컴포넌트를 통해 테스트 생성 도구를 가이드하여 리셋 메서드를 호출하고 패치를 생성하는 방법론 구현.

딥러닝 기반 폴리에스터 섬유의 염색색상 결과예측 모형 개발

· 약 4분
이우창
손현식
이충권

논문 정보

  • 제목: 딥러닝 기반 폴리에스터 섬유의 염색색상 결과예측 모형 개발 (Development of a model for predicting dyeing color results of polyester fibers based on deep learning)
  • 저자: 이우창(다이텍연구원), 손현식(다이텍연구원), 이충권(계명대학교 경영정보학전공 교수)
  • 학회/저널: 스마트미디어저널 (Smart Media Journal)
  • 발행일: 2022-04-18
  • DOI: 10.30693/SMJ.2022.11.3.74
  • 주요 연구 내용: 폴리에스터 섬유 염색 공정 최적화를 위해 376건의 실험 데이터를 수집하고, 이를 다층퍼셉트론(MLP), CNN, LSTM 딥러닝 모델에 학습시켜 최종 염색 색상(L*, a*, b*)을 예측함. 각 모델의 성능은 K-겹 교차 검증을 통해 평가 및 비교됨.
  • 주요 결과 및 결론: 세 가지 모델 중 염색 공정의 순차적 특성을 반영한 LSTM 모델이 가장 우수한 예측 성능을 보임. LSTM 모델은 CMC(2:1) 색차 평균이 0.6479로 가장 낮았고, L*, a*, b* 각 값에 대한 R-Square 값도 가장 높아 분산 설명력이 뛰어났음.
  • 기여점: 본 연구는 딥러닝 기술을 염색 공정에 적용하여 객관적인 색상 예측 모델을 개발함. 특히 LSTM 모델의 우수성을 입증함으로써, 작업자의 숙련도에 대한 의존도를 낮추고 재염 발생을 줄여 염색 공정의 효율성과 품질을 최적화할 수 있는 가능성을 제시함.

Analysing an imbalanced stroke prediction dataset using machine learning techniques

· 약 5분
Viswapriya Subramaniyam Elangovan
Rajeswari Devarajan
Osamah I. Khalaf
Mhd Saeed Sharif
Wael Elmedany

논문 정보

  • 제목: Analysing an Imbalanced Stroke Prediction Dataset Using Machine Learning Techniques
  • 저자: Viswapriya Subramaniyam Elangovan (SRM Institute of Science and Technology), Rajeswari Devarajan (SRM Institute of Science and Technology), Osamah I. Khalaf (Al-Nahrain University), Mhd Saeed Sharif (UEL University), Wael Elmedany (University of Bahrain)
  • 학회/저널: KIJOMS
  • 발행일: 2022-01-01
  • DOI: DOI 링크 없음
  • 주요 연구 내용: Kaggle의 공개 뇌졸중 예측 데이터셋은 소수 클래스(뇌졸중 환자)가 매우 적은 불균형 문제를 가짐. 이 문제를 해결하기 위해 SMOTE와 Adasyn 같은 오버샘플링 기법을 적용하여 데이터셋의 균형을 맞추고, 제안하는 하이브리드 신경망-랜덤 포레스트(NN-RF) 모델의 성능을 평가함.
  • 주요 결과 및 결론: 제안된 NN-RF 모델은 Adasyn 오버샘플링 기법을 적용했을 때 가장 높은 성능을 보였음. F1-score 75%, 정확도 84%, AUC 86%를 달성하여 다른 벤치마킹 알고리즘(DT, LR, NN, RF)보다 우수한 예측 성능을 입증함.
  • 기여점: 데이터 불균형 문제를 해결하기 위한 오버샘플링 기법의 효과를 검증함. 또한, 기존 단일 모델들의 한계를 극복하기 위해 신경망과 랜덤 포레스트를 결합한 하이브리드 모델을 제안하고 그 우수성을 실험적으로 증명함.

생분해성 섬유 방사 공정 데이터 특성을 고려한 물성 예측 모델 개발

· 약 4분
박세찬
경북대학교 컴퓨터학부 박사
김덕엽
경북대학교 컴퓨터학부 박사과정생
서강복
경북대학교 컴퓨터학부 박사
이우진
경북대학교 컴퓨터학부 전임교수

논문 정보

  • 제목: 생분해성 섬유 방사 공정 데이터 특성을 고려한 물성 예측 모델 개발 (The Development of Property Prediction Model in Consideration of Biodegradable Fiber Spinning Process Data Characteristics)
  • 저자: 박세찬, 김덕엽, 서강복, 이우진 (경북대학교 컴퓨터학부)
  • 학회/저널: ASK 2022 학술발표대회 논문집
  • 발행일: 2022-01-01
  • DOI: 제공되지 않음
  • 주요 연구 내용: 섬유 방사 공정 데이터는 양이 적고 분포가 불균형하며, 동일 조건 샘플 간에도 오차가 존재하는 특성이 있음. 본 논문은 이러한 특성을 반영하여, 물성 단위와 허용오차를 고려한 이상치 처리 기법과 데이터 불균형 정도 및 물성과의 상관성을 고려한 오버샘플링 기법을 제안함.
  • 주요 결과 및 결론: 제안된 데이터 전처리 기법들을 MLP 모델에 적용한 결과, 조정된 결정계수는 0.479에서 0.789로 크게 향상되었고, 평균절대오차는 0.165에서 0.120으로 약 27% 감소함. 이를 통해 모델의 데이터 적합도와 예측 정확성이 크게 개선되었음을 확인함.
  • 기여점: 데이터 확보가 어려운 섬유 방사 공정의 현실적인 문제를 해결하기 위해 도메인 지식(공정관리한계 허용오차)을 활용한 데이터 처리 기법을 제안함. 데이터 불균형과 상관성을 동시에 고려한 오버샘플링을 통해 물성 예측 모델의 성능을 실질적으로 개선하여 AI 기술의 현장 적용 가능성을 높임.

Fabric Defect Classification Using Combination of Deep Learning and Machine Learning

· 약 3분
Semih UTKU
Hakan ÖZDEMİR

논문 정보

  • 제목: Fabric Defect Classification Using Combination of Deep Learning and Machine Learning
  • 저자: Fatma Günseli YAŞAR ÇIKLAÇANDIR (İzmir Katip Çelebi University), Semih UTKU (Dokuz Eylul University), Hakan ÖZDEMİR (Dokuz Eylul University)
  • 학회/저널: Journal of Artificial Intelligence and Data Science (JAIDA)
  • 발행일: 2021-08-12
  • DOI: 제공되지 않음
  • 주요 연구 내용: 딥러닝 모델(ResNet18, GoogLeNet)을 이용한 원단 불량 분류와, 이 모델들에서 특징만 추출하고 분류는 SVM(Support Vector Machines)으로 수행하는 하이브리드 방식의 성능을 비교 분석함. 딥러닝의 단점인 긴 처리 시간을 개선하는 것을 목표로 함.
  • 주요 결과 및 결론: 순수 ResNet18 모델이 가장 높은 분류 정확도(최대 87.5%)를 보였으나, ResNet18로 특징을 추출하고 SVM으로 분류하는 하이브리드 모델은 정확도 저하가 크지 않으면서도 분류 시간을 약 60배 단축시키는 결과를 보임.
  • 기여점: 딥러닝의 높은 특징 추출 능력과 머신러닝 분류기의 속도 이점을 결합하여, 원단 불량 검출 시스템에서 시간 효율성과 정확성 간의 균형을 맞춘 실용적인 접근법을 제시함. 이를 통해 속도가 중요한 실제 생산 환경에 적용 가능한 지능형 시스템의 가능성을 보임.

Improving Viewing Experiences of First-Person Shooter Gameplays with Automatically-Generated Motion Effects

· 약 6분
Gyeore Yun
POSTECH 연구원
Hyoseung Lee
Sangyoon Han
Seungmoon Choi
POSTECH 교수

논문 정보

  • 제목: Improving Viewing Experiences of First-Person Shooter Gameplays with Automatically-Generated Motion Effects
  • 저자: Gyeore Yun, Sangyoon Han, Hyoseung Lee, Seungmoon Choi (Pohang University of Science and Technology)
  • 학회/저널: CHI Conference on Human Factors in Computing Systems (CHI '21)
  • 발행일: 2021-05-08
  • DOI: 10.1145/3411764.3445358
  • 주요 연구 내용: 1인칭 슈팅(FPS) 게임 시청 경험을 향상시키기 위해, 게임의 시청각(audiovisual) 스트림을 분석하여 자동으로 모션 효과를 생성하는 두 가지 알고리즘을 제안함. 첫 번째는 컴퓨터 비전 기술을 이용해 카메라 움직임을 추정하여 캐릭터의 이동을 표현, 두 번째는 딥러닝 모델로 총소리를 탐지하여 총기 반동 효과를 생성함.
  • 주요 결과 및 결론: 사용자 연구 결과, 제안된 모션 효과가 게임 시청의 즐거움과 몰입감을 유의미하게 향상시킴. 특히 캐릭터 움직임과 총기 발사 효과를 결합했을 때(ME-COM) 시너지 효과를 보이며 가장 높은 몰입감과 선호도를 얻음. 모션 효과는 시청자의 게임 집중력을 방해하지 않았으나, 피로도는 다소 증가시키는 것으로 나타남.
  • 기여점: FPS 게임에 특화된 두 가지 모션 합성 알고리즘을 설계하고 통합했으며, 자동으로 생성된 다감각 효과가 e스포츠 시청 경험에 실질적인 이점을 제공한다는 경험적 증거를 제시함. 이는 개발자의 수동 작업 없이 다양한 게임에 4D 효과를 적용할 수 있는 확장 가능한 방법을 제안한다는 점에서 의의가 있음.

Fault Localization with Code Coverage Representation Learning

· 약 5분
Yi Li
Shaohua Wang
Tien N. Nguyen

논문 정보

  • 제목: Fault Localization with Code Coverage Representation Learning
  • 저자: Yi Li, Shaohua Wang, Tien N. Nguyen (New Jersey Institute of Technology, The University of Texas at Dallas)
  • 학회/저널: arXiv:2103.00270v1 (ICSE 2021 등재 연구 기반)
  • 발행일: 2021-02-27
  • 주요 연구 내용: 결함 위치 추정(FL)을 이미지 패턴 인식 문제로 접근하여, 코드 커버리지 행렬(Code Coverage Matrix)의 테스트 케이스를 시각적 패턴이 드러나도록 재정렬하고, 문장 간 데이터 의존성을 학습하여 CNN으로 결함을 탐지하는 DEEPRL4FL 모델을 제안함.
  • 주요 결과 및 결론: Defects4J 벤치마크에서 기존 최고 성능의 Statement-level FL 모델 대비 Top-1 정확도를 173.1%에서 491.7%까지 향상시켰으며, Method-level에서도 기존 기법들을 크게 상회하는 성능을 입증함.
  • 기여점: 단순한 통계적 점수 계산을 넘어 코드 커버리지 행렬의 전체 정보를 활용하는 새로운 표현 학습(Representation Learning) 방식을 제시하고, 테스트 케이스 정렬 알고리즘과 데이터 의존성 통합을 통해 딥러닝 모델의 FL 성능을 극대화함.