Clustering Countries by K-Means Method According to Causes of Death
Cem Gürler
Author Profile
Cem Gürler
Res. Assist., Department of Business Administration, Faculty of Economics and Administrative Sciences Yalova University, Yalova, Turkiye, cem.gurler@yalova.edu.tr
Res. Assist., Department of Business Administration, Faculty of Economics and Administrative Sciences Yıldız Technical University, Istanbul, Turkiye, mcaglar@yildiz.edu.tr
Causes of death are one of the criteria used to assess countries’ health systems and determine their Human Development Levels. Countries are developing health policies based on the causes of death. While mortality rates and causes of death are accepted as development indicators for countries by the United Nations, improvement of public health is considered as a global target. According to the Institute for Health Metrics and Evaluation, 54.15 million deaths occurred in 2015, 71% of which were caused by non-communicable diseases, 20% were caused by communicable diseases, neonatal and nutritional diseases, and the remaining 9% were caused by injuries. In this study, it is aimed to group the countries by considering various causes of death of people in different countries and to investigate whether there is a relationship between the causes of death and the Human Development Level of the countries. In the analysis; 2015 data of 168 countries and 28 different variables showing the causes of death of these countries were used. K-means method was used to group the countries according to causes of death and 4 different models were established by making use of World Health Organization's classification of illness, injury and causes of death. After the cluster analysis, in which clusters the countries are located according to Human Development Level were examined. It is also investigated that whether there is a relationship between the causes of death and the Human Development Level of the countries.
Ölüm Nedenlerine Göre K-Ortalamalar Yöntemi İle Ülkelerin Kümelenmesi
Öz
Ölüm nedenleri, ülkelerin sağlık sistemlerinin değerlendirilmesi ve İnsani Gelişme Düzeylerinin belirlenmesinde kullanılan ölçütlerden birisidir. Ülkeler, ölüm nedenlerine bağlı olarak sağlık politikaları geliştirmektedirler. Ölüm oranları ve ölüm nedenleri Birleşmiş Milletler tarafından ülkeler için gelişmişlik göstergeleri arasında kabul edilirken, toplum sağlığının iyileştirilmesi de küresel ölçekte bir hedef olarak gösterilmektedir. Sağlık Ölçümleri ve Değerlendirme Enstitüsü (Institute for Health Metrics and Evaluation) verilerine göre 2015 yılında 54.15 milyon ölüm meydana gelmiş ve bu ölümlerin %71’i bulaşıcı olmayan hastalık, %20’si bulaşıcı hastalıklar, yeni doğan ve beslenme hastalıkları, kalan %9’u ise yaralanmalardan kaynaklanmıştır. Mevcut çalışmada, farklı ülkelerdeki kişilerin çeşitli ölüm nedenleri dikkate alınarak ülkelerin gruplandırılması ve ölüm nedenleri ile ülkelerin İnsani Gelişme Düzeyi arasında bir ilişkinin olup olmadığının incelenmesi amaçlanmıştır. Analizde; 168 ülke ve bu ülkelerin ölüm nedenlerini gösteren 28 farklı değişkenin 2015 yılı verileri kullanılmıştır. Ülkelerin ölüm nedenlerine göre gruplanması amacıyla k-ortalamalar yöntemi kullanılmış olup, Dünya Sağlık Örgütü’nün hastalık, yaralanma ve ölüm nedenlerini sınıflandırmasından faydalanılarak 4 farklı model kurulmuştur. Kümeleme analizinden sonra ülkelerin İnsani Gelişme Düzeylerine göre hangi kümede yer aldıkları incelenmiştir. Ayrıca ölüm nedenleri ile ülkelerin İnsani Gelişme Düzeyi arasında bir ilişki olup olmadığı da araştırılmıştır.
Acemoglu, D., & Johnson, S. (2007). Disease and development: the effect of life expectancy on economic growth. Journal of political Economy, 115(6), 925-985.
Ahlemeyer-Stubbe, A., & Coleman, S. (2014). A practical guide to data mining for business and industry. John Wiley & Sons.
Arora, P., Deepali & Varshney, S. (2016). Analysis of k-means and k-medoids algorithm for big data. Procedia Computer Science, 78, 507-512.
Bloom, D. E., Canning, D., Kotschy, R., Prettner, K. & Schünemann, J. (2018). Health and Economic Growth: Reconciling the Micro and Macro Evidence. IZA Discussion Papers, No. 11940, Institute of Labor Economics (IZA), Bonn
Boutayeb, A., & Boutayeb, S. (2005). The burden of non communicable diseases in developing countries. International journal for equity in health, 4(1), 2.
Bramer, M. (2007). Principles of data mining. Springer, London.
Charrad, M., Ghazzali, N., Boiteau, V., Niknafs, A., & Charrad, M. M. (2014). Package ‘nbclust’. Journal of statistical software, 61, 1-36.
Cios, K. J., Pedrycz, W., Swiniarski, R. W. & Kurgan, L. A. (2007). Data Mining: A Knowledge Discovery Approach. Springer, Boston, MA.
Demiralay, M., & Çamurcu, A. Y. (2005). Cure, agnes ve k-means algoritmalarındaki kümeleme yeteneklerinin karşılaştırılması. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 4(8), 1-18.
Dhanachandra, N., Manglem, K., & Chanu, Y. J. (2015). Image segmentation using K-means clustering algorithm and subtractive clustering algorithm. Procedia Computer Science, 54, 764-771.
Giudici, P. (2005). Applied data mining: statistical methods for business and industry. John Wiley & Sons.
Hill, K. (2006). Making deaths count. Bulletin of the World Health Organization, 84, 162-162.
Kassambara, A., & Mundt, F. (2017). Package ‘factoextra’. Extract and visualize the results of multivariate data analyses, 76.
Khan, S. S., & Ahmad, A. (2004). Cluster center initialization algorithm for K-means clustering. Pattern recognition letters, 25(11), 1293-1302.
Kırmızıgül Çalışkan, S., & Soğukpınar, İ. (2008). KxKNN: K-Means ve K En Yakın Komşu Yöntemleri ile Ağlarda Nüfuz Tespiti. 2. Ağ ve Bilgi Güvenliği Ulusal Sempozyumu, 16-18.
Li, H. (2010, October). Research and implementation of an anomaly detection model based on clustering analysis. In 2010 International Symposium on Intelligence Information Processing and Trusted Computing (pp. 458-462). IEEE.
Li, Y., & Wu, H. (2012). A clustering method based on K-means algorithm. Physics Procedia, 25, 1104-1109.
Liu, G., Yang, J., Hao, Y., & Zhang, Y. (2018). Big data-informed energy efficiency assessment of China industry sectors based on K-means clustering. Journal of cleaner production, 183, 304-314.
Lorentzen, P., McMillan, J., & Wacziarg, R. (2008). Death and development. Journal of economic growth, 13(2), 81-124.
Lozano, R., Naghavi, M., Foreman, K., Lim, S., Shibuya, K., Aboyans, V., ... & AlMazroa, M. A. (2012). Global and regional mortality from 235 causes of death for 20 age groups in 1990 and 2010: a systematic analysis for the Global Burden of Disease Study 2010. The lancet, 380(9859), 2095-2128.
Magnusson, R. S. (2007). Non-communicable diseases and global health governance: enhancing global processes to improve health development. Globalization and Health, 3(1), 2.
Sarıman, G. (2011). Veri madenciliğinde kümeleme teknikleri üzerine bir çalışma: k-means ve k-medoids kümeleme algoritmalarının karşılaştırılması. Süleyman Demirel Üniversitesi Fen Bilimleri Enstitüsü Dergisi, 15(3), 192-202.
Velmurugan, T., & Santhanam, T. (2011). A Survey of Partition based Clustering Algorithms in Data Mining: An experimental approach. Information Technology Journal, 10(3), 478-484.
World Health Organization. (2003). Macroeconomics and health: an update: increasing investments in health outcomes for the poor: second consultation on macroeconomics and health (No. WHO/SDE/CMH/03.1). Geneva: World Health Organization.
alphanumeric journal has been publishing as "International Peer-Reviewed
Journal" every six months since 2013. alphanumeric serves as a vehicle for researchers and
practitioners in the field of quantitative methods, and is enabling a process of sharing in all
fields related to the operations research, statistics, econometrics and management informations
systems in order to enhance the quality on a globe scale.