타우데이타 주식회사 정화민 대표이사(서강대학교 정보통신대학원 데이터사이언스 & AI 전공 겸임교수/Ph.D)는 2024년 1월부터 2024년 2월까지 선문대학교와 함께 산학 S/W 전문 인재 양성 2차 프로젝트를 진행하였다고 하였다. 타우데이타 주식회사는 그 동안의 인공지능 빅데이터 관련 특허기술을 인재양성에도 활용하고자 지난해 2023년 IoT & AI 개발과정에 선문대학교 소프트웨어 중점사업단과 함께 1차 프로그램에 참여하였다. 이번 기수에는 “산학공동”으로 헬스케어 빅데이터를 활용한 다음과 같은 중간 프로젝트를 진행했다고 하였다.(2024년 2월 15일).
다음
1. 머신러닝기반 비침습 당뇨병 예측(팀원:김재민,박기표,이창진,정윤식)
2. 빅데이터를 이용한 당뇨병 예측 및 AI기반 개인별 맞춤 혈당 관리 서비스(팀원 :강원규,이강재,배상인,남영빈,양민규)
3. 정확도가 향상된 AI기반 당뇨병 예측분류(팀원:김재겸,안지성,현기호,황창희)
4. 머신러닝 기반 비만 영향요인 분석 및 분류 정확도 개선 모델링(팀원:이재영, 이승한, 민수지, 김하늘)
5. 건강 빅데이터를 활용한 AI기반 고혈압 예측 플랫폼 (팀원:강소희, 최건, 류명재, 유용재, 유범용)
이와 관련, 실무 교육을 담당하는 선문대학교 노영훈 교수는 타우데이타 주식회사와 협력하여 헬스케어 분야에서 인공지능과 빅데이터를 활용한 프로젝트들을 진행한 것은 실제 문제 해결에 기여할 수 있는 능력을 갖추고 있음을 보여주며, 당뇨병 예측, 개인별 맞춤 혈당 관리 서비스, 정확도가 향상된 AI 기반 당뇨병 예측 분류, 비만 영향 요인 분석, 고혈압 예측 플랫폼 등의 프로젝트는 여러분의 역량을 선보이는 데 있어 훌륭한 사례가 될 것이라고 밝혔다.
또한, 선문대학교 소프트웨어중심대학사업단의 최재성 교수는 “지금까지 헬스케어 분야에서 AI와 머신러닝을 활용한 프로젝트에 기여한 것은 매우 인상적이며, 이러한 경험은 학생들의 학문적으로나 실무적으로 발전의 큰 자산이 될 것이라고 하였다. 더욱이, 금년 5월부터 시작될 ICT 이노베이션 과정에서도 빅데이터와 인공지능 서비스 관련 프로그램이 마련되어 학생들의 취업 준비와 포트폴리오 구축에 큰 도움이 될 것이라며, 학교에서는 학생들의 실질적인 역량을 개발하고, 졸업 후에도 경쟁력 있는 전문가로 성장할 수 있도록 지원하고자 한다고 하였다”.
-학생 소감-
이승한:국민건강보험공단의 빅데이터를 활용하여서 혈액 검사를 통해 비만 위험도를 분류하는 프로젝트를 하였습니다. 이 프로젝트를 진행하면서 결과를 보여주려면 과정의 중요성을 느꼈습니다. 데이터를 분석하면서 전처리 과정, 모델 선정, 해석함에 따라서 결과가 달라진다는 것을 느껴서 데이터 분석에서는 과정이 정말 중요하다고 생각했습니다. 그리고 이번 프로젝트는 정말 활용도가 무궁무진할 것으로 생각이 들어서 앞으로 있을 프로젝트에 적용하기에 수월할 것이라는 생각이 들었고 데이터 분석에 더욱 흥미를 느낄 수 있었던 프로젝트였습니다.
이재영: 개인적으로 이전보다 데이터 분석 기법들의 활용목적, 활용 방법, 해석방법 들에 대해 자세하게 배울 수 있어서 좋았습니다. 그로 인해 데이터 분석 능력을 향상시킬 수 있는 좋은 경험이자 기회였습니다. 이번 프로젝트를 통해서 부족한 점도 많이 느꼈지만 데이터 분석에 자신감을 더 많이 얻었고 과제가 어려울지라도 헤쳐나갈 수 있다는 용기를 얻었다는 점에서 굉장히 만족스럽고 가치가 있다고 생각되었습니다.
민수지: AI에 대해 학교 수업 시간에 배운 내용만 알고 깊이는 알지 못했는데 타우데이타 교수님께서 AI를 쉽고 재미있게 가르쳐주셔서 재미있었습니다! 가공된 데이터가 아닌, 실제 우리가 작성한 데이터들을 토대로 분석하는 경험을 처음 겪어봐서 더 집중이 잘 되었고 나중에 응용도 가능할 것 같습니다. 두 달이 되는 시간동안 잘 가르쳐주셔서 감사했습니다!
김하늘: 학교에서 배우지 않았던 데이터 전처리와 RStudio와 파이썬으로 데이터 분석도 하면서 공부도 많이 되었고 rc카도 직접 만들어서 카메라로 얼굴 데이터를 저장해서 저장된 얼굴을 rc카가 따라가는 것과 아래에 있는 라인을 보고 라인대로 가는 것도 하고 스마트 팜으로 식물도 키워보면서 학교에서 직접 해보지 못하는 경험도 많이 하고 쉬는 시간에도 먼저 말걸어 주시면서 자기소개서나 모르는 것들도 알려주시고 강의도 쉽게 설명해 주셔서 좋은 경험과 많은 지식을 얻어 갈 수 있었습니다.
박기표 : 중간프로젝트로 채혈없이 당뇨병을 판단하는 프로젝트를 진행하면서 빅데이터 중에서 전처리를 통해 얻을 수 있는 정제된 데이터를 어떻게 구성해야 하는지 에 대해서 명확하게 파악할 수 있었고, 보다 더 높은 정확도를 얻을 수 있도록 하는 데이터 처리 방법과 다양한 분석을 시도하는 것이 흥미로웠습니다. 비록 채혈관련 데이터를 사용하지 않아서 정확도가 낮았지만 이를 해결하기 위해서 다방면으로 고민하고 해결책을 찾아가려는 모습에서 AI관련 지식과 기술을 체화 할 수 있는 큰 기회가 되었습니다.
정윤식 : 저는 건강 데이터에서 혈액을 이용하지 않고 당뇨병 판단을 하는 프로젝트를 진행하였습니다. 전처리부터 시각화까지 대부분의 과정을 진행하였고 이 과정을 진행하면서 처음부터 마무리까지 만들어가는 과정이 너무 재미있었고 성취감을 느낄 수 있었습니다.
결과는 아쉽게도 저희가 사용한 데이터 만을 이용해서는 정확도가 너무 낮아 실제로 적용하기에는 무리가 있었지만, 이번 프로젝트를 발판으로 해서 앞으로의 프로젝트도 잘 해나갈 수 있는 발판이 되어주는 경험으로 느껴졌습니다. 다시 기회가 된다면 이러한 종류의 프로젝트를 다시 해보고 싶다는 생각이 드는 경험이었습니다.
김재민 : 중간프로젝트로 비침습 혈당측정을 하여 당뇨예측을 하는 프로젝트를 진행하였습니다. 이 프로젝트를 진행하면서 데이터 수집-> 저장-> 처리-> 분석-> 표현 등의 과정을 진행하였고 진행하는 과정에서 데이터 전처리를 어떻게 해야하는지도 알게되었고, 전처리된 데이터를 가지고 분석 모델 의사결정트리, 이분형 로지스틱회귀 등 을 이용하여 분석하였다. AI 분야는 처음이라 AI 더 알게되는 계기가되었다.
이창진 : 데이터 분석에 대해 지식이 없었는데 데이터 전처리, 여러 분석법들을 사용해 보면서 데이터 분석에 대해 이해가 생겨서 좋았습니다.
김재겸: 타학과 출신 사람으로서 우리가 쓰는 데이터가 비교적 구체적으로 전처리 과정을 통해 어떠한 일련의 가공과정을 거치게 되어 우리에게 유의미한 결과를 도출해내는 것에 대해서 이해할 수 있게 되었습니다. 특히 당뇨병의 요인분석 과정을 상관분석, 결정트리분석, 카이제곱분석 등 다양한 분석법을 통해서 제가 이와 같이 분석을 해야되는 상황 속에서 과연 어떠한 분석법이 가장 옳은 것이고 분석된 결과를 비교 및 연관하여 나에게 가장 필요한 결과치를 도출해내는 법에 대해서 공부하고 실습했습니다. 이로서 다른 학과에서도 이와 같은 분석법들은 제가 주장하는 바를 뒷받침해줄 기술적인 근거로서 활용될 가능성을 봤습니다. 이를 통해서 추후 인문계에서 프로젝트를 진행하는 과정에서 저는 이번 강의를 통해서 얻은 지식과 기회를 활용하여 해당 프로젝트가 진행이 되거든 적극적으로 적용시키고 싶습니다.
안지성:분석 기법의 적용: 회귀분석을 통해 변수 간의 관계를 파악하고, 카이제곱검정으로 두 범주형 변수 간의 독립성을 검증하는 방법을 배웠습니다. 이러한 분석을 통해 사업 계획의 가정과 전략에 대한 실증적 근거를 마련할 수 있었습니다. 데이터 전처리의 중요성: 데이터의 정제, 결측치 처리, 변수 변환과 같은 전처리 작업이 분석 결과의 정확성에 큰 영향을 미친다는 것을 이해했습니다. 깨끗하고 정확한 데이터를 확보하는 것이 분석의 첫걸음임을 배웠습니다. 의사결정에의 응용: 분석 결과를 실제 사업 계획에 적용하는 과정에서, 데이터 기반 의사결정의 힘과 한계를 모두 경험했습니다. 분석 결과를 해석하고 이를 통해 실질적인 사업 전략을 수립하는 능력이 중요하다는 것을 배웠습니다. 통신과 설득의 기술: 분석 결과와 이를 바탕으로 한 사업 계획을 이해하기 쉽고 설득력 있게 전달하는 방법을 배웠습니다. 복잡한 분석 결과를 비전문가도 이해할 수 있도록 단순화하여 전달하는 것이 중요함을 깨달았습니다.
현기호:이번 중간프로젝트를 통해 처음으로 AI 분석 방법을 활용하여 당뇨의 영향을 주는 요소에 대해 탐구하게 되었습니다. 이 프로젝트를 통해 AI 기술의 강력함과 다양한 분야에서의 응용 가능성을 몸소 체험하게 되어 매우의미 있었습니다. 프로젝트의 시작은 당뇨에 영향을 미치는 다양한 요소들에 대한 데이터수집과 분석이었습니다. 이를 위해 다양한 데이터 소스를 탐색하고, 데이터 전처리 및 정제를 통해 AI 모델 학습에 적합한 형태로 가공했습니다. 데이터의 품질과 정확성은 분석 결과에 큰 영향을 미치기때문에 이 단계에서의 신경을 많이 쓰게 되었습니다. AI 모델의 학습과 평가 단계에서는 다양한 알고리즘과 기술을 적용하여 최상의 성능을 얻기 위해 노력했습니다. 모델의 예측 능력을 향상시키기 위해 하이퍼파라미터 튜닝과 교차 검증을 수행하며 모델의 강점과 약점을 파악하였습니다. 결과적으로 프로젝트를 통해 얻은 인사이트는 당뇨에 영향을 미치는 주요 요소에 대한 심층적인 이해를 제공했습니다. 이는 질병 예방 및 관리에 새로운 방향성을 제시하고, 개인화된 의료 서비스의 가능성을 보여주었습니다. 프로젝트를 통해 AI 분석 방법을 습득하고 응용함으로써, 앞으로의 의학 및 헬스케어 분야에서의 기여와 발전에 대한 열망이 더욱 강해지게 되었습니다. 이 경험을 통해 팀원들과의 협업 능력, 문제 해결 능력, 그리고 기술적 역량을 향상시킬 수 있었던 것 같아 만족스럽게 마무리할 수 있었습니다. 이 프로젝트를 통해 얻은 경험은 나의 전문성을 확장하고 미래의 프로젝트에서 더 나은 결과물을 도출하는데 큰 역할을 할 것으로 기대됩니다. 앞으로도 다양한 분야에서 AI 기술을 활용하여 사회에 기여하는 데 힘쓰겠습니다.
황창희:AI 빅데이터 수업을 듣고 나니 현대 사회의 핵심 기술과 데이터의 중요성에 대해 명확히 이해할 수 있었습니다. 강의에서는 여러 가지 데이터를 분석하고 활용하는 방법을 배웠는데, 이를 통해 실제 문제를 해결하는 능력이 향상되었습니다. 더불어 데이터의 유형과 처리 과정에 대한 깊은 통찰력을 얻었으며, 이는 미래에 업무나 연구에서 큰 도움이 될 것입니다. 전반적으로 유익한 수업이었고, 미래에 대비하여 끊임없는 학습과 실습이 필요하다는 점을 깨달았습니다.
강원규: 지금까지 AI에 대해서 교육을 진행할 때, 그에 관한분석 기법에 대한 상세한 내용 이 아닌 라이브러리에 대한 간단한 설명만 진행하였지만, 이 수업에서는 AI 학습을 진행하기 위한 데이터 선정 방식 데이터 그에 따른 여러 분석방법을 학습할 수 있는 교육이었습니다. 가공되고 누가 준 데이터가 아닌 우리가 수집한 데이터로 진행한 교육방법이라 신선한 느낌을 주었고 데이터 학습에 대해서 이해를 한층 더 높일수 있었습니다.
이강재: 이번 AI 교육을 통해 데이터에 대한 새로운 시각을 얻게 되어 매우 만족스럽습니다. 자체 수집한 데이터를 활용하여 학습하는 과정에서 현실적인 문제 해결 능력이 향상되었고, 다양한 분석 방법을 터득함으로써 더욱 전문적인 역량을 키울 수 있었습니다.
배상인: 이번 교육을 통해 자체 수집한 데이터를 활용하여 AI 학습에 집중할 수 있어 매우 유익한 경험이었습니다. 실제 데이터를 다루며 AI 모델을 학습시키는 과정에서 데이터의 중요성과 활용 방법에 대한 이해를 깊이 있게 얻을 수 있었습니다.
남영빈: 이번 교육을 통해 데이터에 대한 새로운 접근 방법을 배울 수 있었습니다. 신선한 경험을 통해 AI 학습에 대한 흥미가 더욱 높아졌고, 데이터의 다양한 분석 방법을 습득함으로써 실용적인 역량을 키울 수 있었습니다.
양민규: 이번 교육은 현실적인 데이터를 활용하여 AI 학습에 집중할 수 있는 소중한 기회였습니다. 자체 수집한 데이터를 활용하며 데이터의 가치와 활용 방법에 대해 깊이 있는 이해를 얻었고, 데이터 분석에 대한 자신감을 키울 수 있었습니다. -끝-
Jung Hwa-min, CEO of TauData Inc. and adjunct professor in Data Science & AI at Sogang University’s Graduate School of Information and Communication (Ph.D.), announced that from January 2024 to February 2024, a second phase project was conducted in collaboration with Sunmoon University to nurture specialized talents in academia-industry software. TauData Inc. has previously participated in the first program in 2023 with Sunmoon University’s Software Focused Business Unit, utilizing its patented AI and big data technologies in healthcare for talent development. This cohort undertook the following mid-term projects related to healthcare under an academia-industry joint initiative as of February 15, 2024:
- Non-invasive diabetes prediction based on machine learning (Team: Jae-min Kim, Ki-pyo Park, Chang-jin Lee, Yoon-sik Jung)
- Diabetes prediction using big data and AI-based personalized glucose management service (Team: Won-kyu Kang, Kang-jae Lee, Sang-in Bae, Young-bin Nam, Min-kyu Yang)
- Improved accuracy in AI-based diabetes prediction classification (Team: Jae-gyeom Kim, Ji-sung Ahn, Ki-ho Hyun, Chang-hee Hwang)
- Machine learning-based analysis of obesity factors and improvement of classification accuracy (Team: Jae-young Lee, Seung-han Lee, Su-ji Min, Ha-neul Kim)
- AI-based hypertension prediction platform using health big data (Team: So-hee Kang, Geon Choi, Myung-jae Ryu, Yong-jae Yu, Beom-yong Yu)
In this context, Professor No Young-hoon of Sunmoon University, who is in charge of practical training, stated that executing projects utilizing AI and big data in healthcare with TauData Inc. demonstrates the capability to contribute to real-world problem solving. Projects such as diabetes prediction, personalized glucose management services, improved AI-based diabetes prediction classification, analysis of obesity factors, and hypertension prediction platforms are excellent examples showcasing your competencies.
Moreover, Professor Choi Jae-seong of Sunmoon University’s Software Focused Industry Group mentioned, “The contribution to projects using AI and machine learning in healthcare has been impressive, and such experiences will be a significant asset for students’ academic and practical development. Furthermore, the ICT Innovation course starting in May will include programs related to big data and AI services, which will greatly assist students in preparing for employment and building their portfolios. The university aims to develop students’ practical skills and support their growth into competitive professionals after graduation.”
-Student Impressions-
Seung-han Lee: I worked on a project classifying obesity risk using national health insurance big data and blood tests. This project made me realize the importance of the process in delivering results. Analyzing data and seeing how outcomes change based on data preprocessing, model selection, and interpretation made me understand that the process is crucial in data analysis. This project, with its vast potential applications, made me think it would be easily applicable to future projects and sparked my interest in data analysis.
Jae-young Lee: Personally, I appreciated learning in detail about the purposes, methods, and interpretations of data analysis techniques. It was a great opportunity to enhance my data analysis skills. Despite feeling shortcomings, the project boosted my confidence in data analysis and gave me courage to tackle difficult tasks, making it a highly satisfying and valuable experience.
Su-ji Min: I only knew about AI from school lessons and lacked depth, but Professor TauData made AI easy and fun to learn! It was my first time analyzing based on our own data instead of processed data, which kept me more engaged and seemed applicable in the future. I’m grateful for the two months of learning!
Ha-neul Kim: I learned a lot and studied by analyzing data using RStudio and Python, which I hadn’t learned in school, and by making an RC car that follows faces recognized by its camera and follows lines it sees below. Growing plants in a smart farm was an experience I couldn’t have had in school, and the professor was approachable during breaks, offering advice on resumes and answering questions. The lectures were explained simply, making it a great experience where I gained a lot of knowledge.
Ki-pyo Park: In the mid-project on non-invasive diabetes detection, I understood how to construct refined data from preprocessing and how to achieve higher accuracy in data processing. Although the accuracy was low without blood-related data, the effort to find solutions was a significant opportunity to internalize AI-related knowledge and skills.
Yoon-sik Jung: I worked on a project to diagnose diabetes without using blood data, handling most processes from preprocessing to visualization. I enjoyed the process from start to finish and felt a sense of accomplishment. Although the accuracy was too low to apply practically using only our data, this project felt like a stepping stone for future projects, and I’d like to undertake similar projects again if given the chance.
Kim Jae-min: “In the midterm project, we conducted a non-invasive glucose measurement project to predict diabetes. Throughout this project, we went through processes such as data collection, storage, processing, analysis, and presentation. I learned how to preprocess data and analyze it using models like decision trees and binary logistic regression. This was my first foray into AI, and it served as an opportunity to learn more about the field.
Lee Chang-jin: “I had no prior knowledge of data analysis, but I gained an understanding and found it beneficial as I learned about data preprocessing and various analysis methods.
Kim Jae-gyeom: “Coming from a different field, I gained an understanding of how the data we use goes through a series of processing steps to produce meaningful results. Specifically, during the diabetes factor analysis, I studied and practiced various analysis methods such as correlation analysis, decision tree analysis, and chi-square analysis. This allowed me to see which analysis method was most appropriate in a given situation and how to derive the most necessary results by comparing and correlating analyzed results. I see the potential for these analysis methods to serve as technical evidence supporting my arguments in other disciplines. I hope to actively apply the knowledge and opportunities gained from this course in future humanities projects.
An Ji-seong: “Application of analysis techniques: I learned how to identify relationships between variables through regression analysis and verify the independence between two categorical variables using chi-square tests. These analyses provided empirical evidence for the assumptions and strategies of a business plan. Importance of data preprocessing: I understood how preprocessing tasks like data cleaning, handling missing values, and variable transformation significantly affect the accuracy of analysis results. Acquiring clean and accurate data is the first step in analysis. Application in decision-making: I experienced both the power and limitations of data-based decision-making while applying analysis results to actual business plans. The ability to interpret analysis results and establish practical business strategies is crucial. Skills in communication and persuasion: I learned how to present analysis results and business plans based on them in an understandable and persuasive manner. Simplifying complex analysis results for comprehension by non-experts is essential.
Hyeon Ki-ho: “Through this midterm project, I explored the factors influencing diabetes using AI analysis methods for the first time. This project allowed me to experience the power of AI technology and its applicability in various fields. The project began with collecting and analyzing data on various factors affecting diabetes. We explored various data sources, and through data preprocessing and cleaning, we prepared the data in a form suitable for AI model training. The quality and accuracy of the data greatly influenced our analysis results, so we paid close attention to this stage. During the model training and evaluation phase, we applied various algorithms and techniques to achieve the best performance. We also conducted hyperparameter tuning and cross-validation to improve the model’s predictive ability and understand its strengths and weaknesses. The insights gained from this project provided a deep understanding of the main factors affecting diabetes, offering new directions for disease prevention and management and showcasing the potential for personalized medical services. This project has strengthened my desire to contribute and advance in the fields of medicine and healthcare using AI. The experience has enhanced our teamwork, problem-solving abilities, and technical skills, leading to a satisfying conclusion. The experience from this project is expected to play a significant role in enhancing my expertise and achieving better outcomes in future projects. I look forward to utilizing AI technology to contribute to society in various fields.
Hwang Chang-hee: “After taking the AI and big data class, I clearly understood the importance of core technologies and data in modern society. The lectures taught us various methods for analyzing and utilizing data, enhancing our problem-solving skills. I also gained deep insights into data types and processing, which will be beneficial in my future work and research. Overall, it was an informative class, and I realized the need for continuous learning and practice to prepare for the future.
Kang Won-gyu: “Until now, when conducting AI education, we only provided simple explanations of libraries without going into detail about analysis techniques. However, this class allowed us to learn how to select data for AI training and various analysis methods. The educational method of using data we collected ourselves felt fresh and helped deepen my understanding of data learning.
Lee Kang-jae: “This AI training has given me a new perspective on data, which I am very satisfied with. Learning with our own collected data enhanced my problem-solving skills in real-life situations, and mastering various analysis methods allowed me to develop more professional skills.
Bae Sang-in: “The training was extremely beneficial as it focused on AI learning using our self-collected data. Handling actual data and training AI models highlighted the importance of data and its utilization, deepening my understanding.
Nam Young-bin: “This training allowed me to learn new approaches to data. The fresh experience increased my interest in AI learning, and acquiring various analysis methods helped me develop practical skills.
Yang Min-gyu: “This training was a valuable opportunity to focus on AI learning using realistic data. Utilizing our self-collected data helped me.