Skip to main content

16 posts tagged with "Machine learning"

머신러닝 알고리즘 및 방법론

View All Tags

Explainable machine learning in materials science

· 6 min read
Xiaoting Zhong
연구원
Brian Gallagher
연구원
Shusen Liu
연구원
Bhavya Kailkhura
연구원
Anna Hiszpanski
연구원
T. Yong-Jin Han
연구원

논문 정보

  • 제목: Explainable machine learning in materials science
  • 저자: Xiaoting Zhong, Brian Gallagher, Shusen Liu, Bhavya Kailkhura, Anna Hiszpanski, T. Yong-Jin Han (Lawrence Livermore National Laboratory)
  • 학회/저널: npj Computational Materials
  • 발행일: 2022-09-22
  • DOI: 10.1038/s41524-022-00884-7
  • 주요 연구 내용: 재료과학 분야에서 높은 정확도를 가진 머신러닝 모델의 블랙박스 문제를 해결하기 위한 설명 가능 인공지능(XAI)의 개념과 기술을 소개함. 모델 처리 과정(후처리)과 모델 설계(선행) 측면에서 DNN을 설명하는 다양한 방법을 분류하고, 실제 재료과학 응용 사례를 검토함.
  • 주요 결과 및 결론: 재료과학 연구에서 XAI 기술, 특히 히트맵과 같은 시각화 기법이 모델 예측을 신뢰하고, 모델의 오류 원인을 진단하며, 새로운 과학적 가설을 생성하는 데 효과적임을 보여줌. 또한, XAI가 아직 초기 단계이며 재료과학 데이터의 명확한 정답(ground truth) 부족, 설명 평가의 어려움 등 해결해야 할 과제가 많음을 지적함.
  • 기여점: 재료과학 분야 연구자들에게 XAI에 대한 입문서 역할을 제공하며, 예측 정확도뿐만 아니라 설명 가능성을 원하는 이들에게 유용한 개념적 틀과 실제 적용 사례를 제시함. 논문은 XAI 기술의 유용성을 강조하는 동시에, 무분별한 해석을 피하고 적절한 평가의 필요성을 역설함.

Quality Prediction and Abnormal Processing Parameter Identification in Polypropylene Fiber Melt Spinning Using Artificial Intelligence Machine Learning and Deep Learning Algorithms

· 5 min read
Amit Kumar Gope
연구원
Yu-Shu Liao
연구원
Chung-Feng Jeffrey Kuo
연구원

논문 정보

  • 제목: Quality Prediction and Abnormal Processing Parameter Identification in Polypropylene Fiber Melt Spinning Using Artificial Intelligence Machine Learning and Deep Learning Algorithms
  • 저자: Amit Kumar Gope, Yu-Shu Liao, Chung-Feng Jeffrey Kuo (National Taiwan University of Science and Technology)
  • 학회/저널: Polymers
  • 발행일: 2022-07-04
  • DOI: 10.3390/polym14132739
  • 주요 연구 내용: 딥러닝 신경망을 사용하여 폴리프로필렌(PP) 용융 방사 공정의 다중 품질 특성을 예측하고 최적의 공정 파라미터를 탐색함. 이후, 품질 이상 데이터가 주어졌을 때 랜덤 포레스트를 포함한 여러 머신러닝 및 딥러닝 방법을 비교하여 이상 원인이 되는 공정 파라미터를 식별하는 2단계 진단 시스템을 개발.
  • 주요 결과 및 결론: 랜덤 포레스트 모델이 이상 공정 파라미터 식별에서 가장 우수한 성능을 보임. 단일/이중 요인 식별 정확도 100%, 단일 요인 분류 정확도 98.3%, 이중 요인 분류 정확도 96.0%를 달성하여 제안된 진단 방법의 효과를 입증.
  • 기여점: PP 용융 방사 공정에서 제품 품질 저하의 원인이 되는 공정 파라미터를 신속하고 정확하게 진단하는 인공지능 기반 시스템을 제안함. 이를 통해 기존의 전문가 의존적 분석 시간을 단축하고 공정 제어 안정성을 높여 생산 비용 절감에 기여.

Analysing an imbalanced stroke prediction dataset using machine learning techniques

· 5 min read
Viswapriya Subramaniyam Elangovan
연구원
Rajeswari Devarajan
연구원
Osamah I. Khalaf
연구원
Mhd Saeed Sharif
연구원
Wael Elmedany
연구원

논문 정보

  • 제목: Analysing an Imbalanced Stroke Prediction Dataset Using Machine Learning Techniques
  • 저자: Viswapriya Subramaniyam Elangovan (SRM Institute of Science and Technology), Rajeswari Devarajan (SRM Institute of Science and Technology), Osamah I. Khalaf (Al-Nahrain University), Mhd Saeed Sharif (UEL University), Wael Elmedany (University of Bahrain)
  • 학회/저널: KIJOMS
  • 발행일: 2022-01-01
  • DOI: DOI 링크 없음
  • 주요 연구 내용: Kaggle의 공개 뇌졸중 예측 데이터셋은 소수 클래스(뇌졸중 환자)가 매우 적은 불균형 문제를 가짐. 이 문제를 해결하기 위해 SMOTE와 Adasyn 같은 오버샘플링 기법을 적용하여 데이터셋의 균형을 맞추고, 제안하는 하이브리드 신경망-랜덤 포레스트(NN-RF) 모델의 성능을 평가함.
  • 주요 결과 및 결론: 제안된 NN-RF 모델은 Adasyn 오버샘플링 기법을 적용했을 때 가장 높은 성능을 보였음. F1-score 75%, 정확도 84%, AUC 86%를 달성하여 다른 벤치마킹 알고리즘(DT, LR, NN, RF)보다 우수한 예측 성능을 입증함.
  • 기여점: 데이터 불균형 문제를 해결하기 위한 오버샘플링 기법의 효과를 검증함. 또한, 기존 단일 모델들의 한계를 극복하기 위해 신경망과 랜덤 포레스트를 결합한 하이브리드 모델을 제안하고 그 우수성을 실험적으로 증명함.

생분해성 섬유 방사 공정 데이터 특성을 고려한 물성 예측 모델 개발

· 4 min read
박세찬
경북대학교 컴퓨터학부 박사
김덕엽
경북대학교 컴퓨터학부 박사과정생
서강복
경북대학교 컴퓨터학부 박사
이우진
경북대학교 컴퓨터학부 전임교수

논문 정보

  • 제목: 생분해성 섬유 방사 공정 데이터 특성을 고려한 물성 예측 모델 개발 (The Development of Property Prediction Model in Consideration of Biodegradable Fiber Spinning Process Data Characteristics)
  • 저자: 박세찬, 김덕엽, 서강복, 이우진 (경북대학교 컴퓨터학부)
  • 학회/저널: ASK 2022 학술발표대회 논문집
  • 발행일: 2022-01-01
  • DOI: 제공되지 않음
  • 주요 연구 내용: 섬유 방사 공정 데이터는 양이 적고 분포가 불균형하며, 동일 조건 샘플 간에도 오차가 존재하는 특성이 있음. 본 논문은 이러한 특성을 반영하여, 물성 단위와 허용오차를 고려한 이상치 처리 기법과 데이터 불균형 정도 및 물성과의 상관성을 고려한 오버샘플링 기법을 제안함.
  • 주요 결과 및 결론: 제안된 데이터 전처리 기법들을 MLP 모델에 적용한 결과, 조정된 결정계수는 0.479에서 0.789로 크게 향상되었고, 평균절대오차는 0.165에서 0.120으로 약 27% 감소함. 이를 통해 모델의 데이터 적합도와 예측 정확성이 크게 개선되었음을 확인함.
  • 기여점: 데이터 확보가 어려운 섬유 방사 공정의 현실적인 문제를 해결하기 위해 도메인 지식(공정관리한계 허용오차)을 활용한 데이터 처리 기법을 제안함. 데이터 불균형과 상관성을 동시에 고려한 오버샘플링을 통해 물성 예측 모델의 성능을 실질적으로 개선하여 AI 기술의 현장 적용 가능성을 높임.

Fabric Defect Classification Using Combination of Deep Learning and Machine Learning

· 3 min read
Semih UTKU
연구원
Hakan ÖZDEMİR
연구원

논문 정보

  • 제목: Fabric Defect Classification Using Combination of Deep Learning and Machine Learning
  • 저자: Fatma Günseli YAŞAR ÇIKLAÇANDIR (İzmir Katip Çelebi University), Semih UTKU (Dokuz Eylul University), Hakan ÖZDEMİR (Dokuz Eylul University)
  • 학회/저널: Journal of Artificial Intelligence and Data Science (JAIDA)
  • 발행일: 2021-08-12
  • DOI: 제공되지 않음
  • 주요 연구 내용: 딥러닝 모델(ResNet18, GoogLeNet)을 이용한 원단 불량 분류와, 이 모델들에서 특징만 추출하고 분류는 SVM(Support Vector Machines)으로 수행하는 하이브리드 방식의 성능을 비교 분석함. 딥러닝의 단점인 긴 처리 시간을 개선하는 것을 목표로 함.
  • 주요 결과 및 결론: 순수 ResNet18 모델이 가장 높은 분류 정확도(최대 87.5%)를 보였으나, ResNet18로 특징을 추출하고 SVM으로 분류하는 하이브리드 모델은 정확도 저하가 크지 않으면서도 분류 시간을 약 60배 단축시키는 결과를 보임.
  • 기여점: 딥러닝의 높은 특징 추출 능력과 머신러닝 분류기의 속도 이점을 결합하여, 원단 불량 검출 시스템에서 시간 효율성과 정확성 간의 균형을 맞춘 실용적인 접근법을 제시함. 이를 통해 속도가 중요한 실제 생산 환경에 적용 가능한 지능형 시스템의 가능성을 보임.

XGBoost: A Scalable Tree Boosting System

· 6 min read
Tianqi Chen
University of Washington 연구원
Carlos Guestrin
연구원

논문 정보

  • 제목: XGBoost: A Scalable Tree Boosting System
  • 저자: Tianqi Chen (University of Washington), Carlos Guestrin (University of Washington)
  • 학회/저널: KDD '16 (The 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining)
  • 발행일: 2016-08-13
  • DOI: 10.1145/2939672.2939785
  • 주요 연구 내용: 본 논문은 확장 가능한 엔드투엔드 트리 부스팅 시스템인 XGBoost를 제안함. 희소 데이터를 효율적으로 처리하기 위한 새로운 희소성 인지 알고리즘(sparsity-aware algorithm)과 근사 트리 학습을 위한 가중치 분위 스케치(weighted quantile sketch)를 도입함. 또한, 캐시 접근 패턴, 데이터 압축, 샤딩(sharding)과 같은 시스템 최적화를 통해 확장성을 극대화함.
  • 주요 결과 및 결론: XGBoost는 단일 머신에서 기존 솔루션보다 10배 이상 빠른 성능을 보이며, 분산 및 메모리 제한 환경에서도 수십억 개의 대용량 데이터를 훨씬 적은 리소스로 처리할 수 있음. 이러한 알고리즘과 시스템 최적화의 결합을 통해 실제 대규모 문제를 해결하는 강력한 솔루션 제공.
  • 기여점: 고도로 확장 가능한 엔드투엔드 트리 부스팅 시스템을 설계 및 구축함. 병렬 트리 학습을 위한 새로운 희소성 인지 알고리즘과 효율적인 제안 계산을 위한 이론적으로 정당화된 가중치 분위 스케치를 제안함. 또한, 메모리 외부(out-of-core) 트리 학습을 위한 효과적인 캐시 인식 블록 구조를 도입하여 시스템 효율성을 높임.