Teknik-teknik pengelompokan berasaskan pengoptimuman yang diinspirasikan daripada alam semulajadi adalah berkuasa, teguh dan lebih canggih daripada kaedah-kaedah pengelompokan konvensional disebabkan ciri stokastik dan heuristik teknik-teknik tersebut. Namun demikian, algoritma-algoritma ini mempunyai beberapa kelemahan seperti kecenderungan untuk terperangkap dalam optima tempatan dan kadar penumpuan yang lambat. Kelemahan yang kedua adalah akibat daripada kesukaran dalam mengimbangi proses eksplorasi dan eksploitasi yang mana telah mempengaruhi secara langsung kualiti akhir proses pengelompokan. Oleh itu, penyelidikan ini telah mencadangkan tiga kerangka kerja yang ditambah baik iaitu Pengoptimuman berasaskan Graviti (OGC), Pengoptimuman Kawanan Zarah berasaskan Ketumpatan (DPSO), dan Evolusi Kebezaan berasaskan Varians dengan Lintas Pilihan (VDEO) untuk proses pengelompokan data. Dalam kerangka kerja OGC, sifat pencarian penerokaan algoritma Penggugusan Graviti (GC) telah ditambahbaik dengan (i) menghapuskan penumpukan halaju ejen, dan (ii) mengintegrasikan kaedah pememulaan agen-agen menggunakan varians dan median untuk menyusun proses eksplorasi. Selain itu, keseimbangan antara proses eksplorasi dan eksploitasi dalam kerangka kerja DPSO dipertimbangkan dengan menggunakan gabungan (i) teknik penganggaran ketumpatan inti yang berkaitan dengan kaedah penganggaran lebar jalur baharu dan (ii) anggaran pekali pembelajaran graviti pelbagai dimensi. Akhir sekali, (i) perwakilan penyelesaian berasaskan tunggal, (ii) skim mutasi boleh ubah, (iii) anggaran berasaskan vektor bagi faktor mutasi, dan (iv) strategi lintas pilihan dicadangkan dalam kerangka kerja VDEO. Prestasi keseluruhan ketiga-tiga kerangka kerja yang dicadangkan ini telah dibandingkan dengan beberapa algoritma-algoritma pengelompokan terkini menggunakan 15 set data daripada repositori UCI. Keputusan-keputusan eksperimen juga dinilai dengan teliti dan disahkan dengan analisis statistik tak berparameter. Berdasarkan keputusan-keputusan eksperimen yang diperolehi, kerangka OGC, DPSO, dan VDEO masing-masing telah mencapai peningkatan purata sehingga 24.36%, 9.38%, dan 11.98% untuk kejituan klasifikasi. Semua kerangka kerja juga telah mencapai kedudukan pertama dalam ujian Pangkat Sejajar Friedman (FA) dalam semua metrik penilaian. Selain itu, ketiga-tiga kerangka kerja tersebut telah menghasilkan penumpuan pencapaian dari segi kebolehulangan. Kerangka kerja OGC telah menghasilkan prestasi yang ketara dari segi kejituan klasifikasi, manakala kerangka kerja VDEO telah menunjukkan prestasi yang ketara dari segi kepadatan kelompok. Dalam hal lain, kerangka kerja DPSO mempunyai kelebihan dari segi keseimbangan keadaan dengan menghasilkan keputusan yang sangat kompetitif berbanding OGC dan DPSO dalam kedua-dua metrik penilaian. Sebagai kesimpulan, mengimbangi kelakuan pencarian telah dengan jelasnya meningkatkan prestasi keseluruhan ketiga-tiga kerangka kerja yang dicadangkan dan menjadikan setiap kerangka kerja tersebut sebagai alat yang sangat baik untuk pengelompokan data. _______________________________________________________________________
Nature-inspired optimization-based clustering techniques are powerful, robust and more sophisticated than the conventional clustering methods due to their stochastic and heuristic characteristics. Unfortunately, these algorithms suffer with several drawbacks such as the tendency to be trapped or stagnate into local optima and slow convergence rates. The latter drawbacks are consequences of the difficulty in balancing the exploration and exploitation processes which directly affect the final quality of the clustering solutions. Hence, this research has proposed three enhanced frameworks, namely, Optimized Gravitational-based (OGC), Density-Based Particle Swarm Optimization (DPSO), and Variance-based Differential Evolution with an Optional Crossover (VDEO) frameworks for data clustering. In the OGC framework, the exhibited explorative search behavior of the Gravitational Clustering (GC) algorithm has been addressed by (i) eliminating the agent velocity accumulation, and (ii) integrating an initialization method of agents using variance and median to subrogate the exploration process. Moreover, the balance between the exploration and exploitation processes in the DPSO framework is considered using a combination of (i) a kernel density estimation technique associated with new bandwidth estimation method and (ii) estimated multi-dimensional gravitational learning coefficients. Lastly, (i) a single-based solution representation, (ii) a switchable mutation scheme, (iii) a vector-based estimation of the mutation factor, and (iv) an optional crossover strategy are proposed in the VDEO framework. The overall performances of the three proposed frameworks have been compared with several current state-of-the-art clustering algorithms on 15 benchmark datasets from the UCI repository. The experimental results are also thoroughly evaluated and verified via non-parametric statistical analysis. Based on the obtained experimental results, the OGC, DPSO, and VDEO frameworks achieved an average enhancement up to 24.36%, 9.38%, and 11.98% of classification accuracy, respectively. All the frameworks also achieved the first rank by the Friedman aligned-ranks (FA) test in all evaluation metrics. Moreover, the three frameworks provided convergent performances in terms of the repeatability. Meanwhile, the OGC framework obtained a significant performance in terms of the classification accuracy, where the VDEO framework presented a significant performance in terms of cluster compactness. On the other hand, the DPSO framework favored the balanced state by producing very competitive results compared to the OGC and DPSO in both evaluation metrics. As a conclusion, balancing the search behavior notably enhanced the overall performance of the three proposed frameworks and made each of them an excellent tool for data clustering.