
学位论文简介
在科学迅速发展的浪潮中,许多新颖且高效的技术被提出并应用于人类现代生活的各个领域。目前,诸如人工智能(AI)及其子集——机器学习(ML)和深度学习(DL)等最新术语正变得越来越普及,为人类生活带来了更多便利与舒适。基于AI的系统能够完成大量工作,如自动化重复且耗时的任务、更快速准确地处理和分析数据、发现模式以支持更优的决策制定等。因此,AI及其在社会生活各方面的应用已经成为一个热门的研究课题。
越南是一个发展中国家,在过去40年里经历了显著的经济增长。然而,仍然存在一些限制和挑战,可能会阻碍越南及其经济的发展。在影响越南经济的关键领域中,医疗保健、农业和交通运输应被视为最主要的领域,因为它们不仅直接对国家经济产生巨大影响,而且彼此相互作用,影响彼此的发展。因此,提升这三大关键领域中的任何一个领域的质量,最终都将带动其他领域以及越南整体经济的发展。本论文利用人工智能技术,旨在促进这三个对越南经济增长有显著影响的关键领域的发展。论文的主要贡献如下:
(1) 医疗保健是任何国家发展的基础,因为它能够维持一个健康的劳动力队伍。就越南的医疗体系而言,医疗诊断和治疗的费用昂贵,人们为医疗服务支付的费用远高于普通家庭的平均收入。因此,应尽早从最初的症状开始预测和治疗疾病。此外,越南人现在越来越重视健康促进和疾病预防,也就是说,在治疗前后都更加关注自身健康。因此,应用最新技术以支持医疗服务成为当务之急。因此,本论文在医疗领域主要研究两个方面:医院再次入院的预测和乳腺癌的分类。医院再次入院是衡量医院质量,特别是治疗流程的重要指标之一。为了提高预测的准确性,论文实现并评估了五种不同的机器学习技术,这些技术在一个由多家美国医院收集的大型公开数据集上进行测试,以确定哪种技术能取得最佳效果。实验结果表明,XGBoost在多个指标上表现优异,其准确率、精确率、召回率和F1分数分别达到了0.96、0.99、0.92和0.9。接下来,对于乳腺癌的分类(这是一种在女性中极为常见且危险的疾病),本论文提出了一种新颖的方法。首先,采用线性判别分析 降低数据维度;随后,应用XGBoost算法进行分类。为了评估该方法的性能,论文将其与在Breast Cancer Wisconsin数据集上的其他方法进行了对比。实验结果显示,XGBoost模型在平均准确率 (0.987)和AUC指数(0.984)方面均优于其他模型。此外,XGBoost模型的RMSE为0.115,比其他模型的误差至少低2.6%。此外,本论文还实现了一个深度神经网络模型用于解决相同问题,应用于同一个乳腺癌数据集后,结果表明该模型在性能上同样表现出色。
(2) 农业被认为是人类的主要食物来源,因此直接影响人类的营养健康。如果无法获得足够的营养食品,个体将面临营养不良的风险,进而严重影响健康。论文作者在越南长大,该国是一个主要依赖农业生产的发展中国家,因此,提高农产品质量不仅有助于经济增长,也有助于改善国民健康质量。在农业领域中,本论文主要研究两个方面:天气预测和无线传感器网络中的能耗优化。天气预报对于维护和提升农产品的质量和数量非常重要。论文采用长短期记忆网络(LSTM),这是一种循环神经网络,用于在Amazon SageMaker(一种常用的云计算服务)上提升天气预测的能力。输入数据来自一个包含多个参数(如日出时间、日落时间、湿度等)的多月数据集。根据评估结果,该方法在准确率、精确率、召回率和F1分数方面分别达到了0.64、0.72、0.84和0.76。在第二方面,无线传感器网络在农业中越来越受欢迎,它们可以通过在感兴趣区域部署的传感器帮助农民实时了解农田的最新情况。然而,频繁为传感器充电并不方便,尤其是当它们被设置在地下时。因此,优化传感器的能耗是一个非常重要的任务。为了解决这个问题,论文提出了一种新颖的方法,使用基于聚类的模糊C均值方法,以延长传感器的工作时间,该方法涵盖了地上和地下节点。该算法在不同地形条件下进行了评估,并与最新的现有方法进行了比较。结果表明,该算法的能效比对比算法高出最多60%。此外,结果还证明该方法在各种连接类型中实现了更均衡的连接分布。
(3) 交通运输对于任何国家的经济维持和发展都至关重要。一个良好的交通系统能够连接不同地区,支持本地乃至全球的贸易,从而最终增强整体经济的韧性。此外,在当今的大都市中,交通拥堵每天都会发生,尤其是在上下班高峰时段。这些严重的情况会导致人们极大的压力,并污染周围环境,从而对人类健康构成巨大威胁。因此,在像越南这样的发展中国家中建立一个交通辅助系统以避免交通堵塞非常有必要,因为在这些国家,大多数人都以摩托车作为主要交通工具。如果能够早期检测到交通堵塞,就能尽快向其他驾驶者发出警报,方便他们采取下一步措施。一种有前景的交通辅助系统解决方案是使用公共摄像头采集的图像或视频来分析和报告交通拥堵情况。近年来,变换器(Transformer)这一在自然语言处理领域广泛应用的方法,已被应用于计算机视觉(CV)领域,目的是取代传统的卷积神经网络(CNN),因为基于Transformer的方法在解决CV任务中表现出了显著优势。Transformer模型能够通过自注意力机制建模长距离依赖关系。迄今为止,已经提出了多种基于Transformer的方法,因此,理解和比较这些方法的优缺点是必要的。在本论文中,作为构建交通拥堵检测系统的第一步,我们对Transformer方法在不同CV任务中的应用(包括图像相关任务和视频相关任务)进行了全面分析和讨论。此外,还讨论了Transformer在扩散模型中的重要性,以支持CNN学习反向过程,从而最终从噪声中重建出图像。总体来看,当在两个常见数据集上进行评估时,基于Transformer的方法在解决CV中的多种任务时表现出了强大的能力。
主要学术成果
[1]. Le D P C*, Dong W, Le V T. “A Comprehensive Survey of Recent Transformers in Image, Video and Diffusion Models,” Computers, Materials & Continua, vol. 80, no. 1, pp. 1-22, 2024 (SCIE-Q3, IF: 2.1; Ei Compendex). DOI: https://doi.org/10.32604/cmc.2024.050790
[2]. Le D P C*, Dong W, Tran N N K, et al. “Advanced Cloud Computing Services: The Evaluation of A Development Roadmap for Emerging Fields in Vietnam,” Journal of Critical Reviews, vol 7, no. 17, pp. 3085-3105, 2020 (Scopus).
[3]. Le D P C*, Dong W. “A Comparison of Machine Learning Methods to Predict Hospital Readmission of Diabetic Patient,” Studies of Applied Economics, vol 39, no. 4, pp. 1-15, 2021 (Scopus).
[4]. Le D P C*, Dong W, Le M N U. “Recent Study on Breast Cancer Prediction Based on Deep Neural Network Model Implemented AWS Machine Learning Platform,” Advanced Aspects of Engineering Research, vol 11, pp. 22-32, 2021
[5]. Hoang D T, Yang P L, Le D P C*, et al. “Weather Prediction based on LSTM model implemented AWS Machine Learning Platform,” International Journal for Research in Applied Science and Engineering Technology, vol 8, no. V, pp. 1-10, 2020.
[6]. Le M N U, Zhou J, Le D P C*, et al. “Ensemble of XGBoost Classifiers Based on LDA Dimensionality Reduction for Predicting Breast Cancer,” Universal Journal of Public Health, vol. 12, no. 3, pp. 434-440, 2024 (Scopus).
[7]. Le D P C*, Dong W, Nguyen H T. Improving Connectivity and Optimizing Energy Consumption of 3D Wireless Sensor Network Using Fuzzy C-Means Clustering (Under Review).