Algoritma Genetika Python34 (GA)

2024-07-12

1. Sejarah perkembangan

Algoritma Genetika (GA) merupakan algoritma optimasi yang terinspirasi dari seleksi alam dan genetika. Ini pertama kali diusulkan oleh sarjana Amerika John Holland pada tahun 1970an, yang bertujuan untuk mempelajari kemampuan beradaptasi dalam sistem alami dan diterapkan pada masalah optimasi dalam ilmu komputer.

Sejarah perkembangan utama

1975: John Holland pertama kali mengemukakan konsep algoritma genetika dalam bukunya “Adaptation in Natural and Artificial Systems”.
tahun 1980-an: Algoritma genetika mulai digunakan dalam bidang-bidang seperti optimasi fungsi dan optimasi kombinatorial, dan secara bertahap menarik perhatian.
tahun 1990-an: Dengan peningkatan daya komputasi komputer, algoritma genetika telah banyak digunakan di bidang teknik, ekonomi, biologi dan bidang lainnya.
tahun 2000an hingga saat ini: Teori dan penerapan algoritma genetika semakin berkembang, dan berbagai algoritma perbaikan telah bermunculan, seperti遗传编程(Pemrograman Genetik)差分进化(Evolusi Diferensial) dll.

2. Prinsip matematika

Algoritma genetika adalah metode pencarian acak berdasarkan seleksi alam dan genetika. Ide dasarnya adalah untuk mensimulasikan proses evolusi biologis.memilih、menyeberangDanMutasiOperasinya, terus menghasilkan populasi generasi baru, sehingga secara bertahap mendekati solusi optimal.

Langkah-langkah dasar algoritma genetika

inisialisasi: Menghasilkan populasi awal secara acak.
memilih: Memilih individu yang lebih baik berdasarkan fungsi kebugaran.
menyeberang: Menciptakan individu baru dengan menukarkan sebagian gen dari individu induk.
Mutasi: Mengubah beberapa gen suatu individu secara acak.
Pengulangan: Mengulangi proses seleksi, pindah silang, dan mutasi hingga kondisi terminasi terpenuhi.

deskripsi matematika

Asumsikan ukuran populasi adalah N dan panjang kromosom setiap individu adalah L. Proses matematis dari algoritma genetika adalah sebagai berikut:

inisialisasi: Hasilkan populasi, dimana kromosomnya.
Perhitungan kebugaran: Menghitung nilai kebugaran masing-masing individu.
memilih: Memilih individu berdasarkan nilai kebugaran. Metode yang umum digunakan meliputi pemilihan roulette, pemilihan turnamen, dll.
menyeberang: Memilih beberapa individu untuk operasi crossover guna menghasilkan individu baru.
Mutasi: Melakukan operasi mutasi pada beberapa individu baru untuk menghasilkan individu yang bermutasi.
memperbarui populasi: Mengganti individu lama dengan individu baru sehingga membentuk populasi generasi baru.
Kondisi penghentian: Jika kondisi terminasi yang telah ditetapkan (seperti jumlah iterasi atau ambang kebugaran) tercapai, solusi optimal akan dihasilkan.

3. Skenario penerapan

Algoritma genetika telah banyak digunakan di banyak bidang karena kemampuan beradaptasi dan ketahanannya:

Optimalisasi teknik

Optimalisasi struktural: Desain struktur ringan dan berkekuatan tinggi.
Optimalisasi parameter: Menyesuaikan parameter sistem untuk kinerja optimal.

Ekonomi dan Keuangan

Optimasi Portofolio: Mengalokasikan aset investasi untuk memaksimalkan keuntungan.
prediksi pasar: Memprediksi harga saham dan tren pasar.

bioinformatika

Perbandingan urutan gen: Membandingkan dan menganalisis urutan DNA.
Prediksi struktur protein: Memprediksi struktur tiga dimensi suatu protein.

pembelajaran mesin

Pelatihan jaringan saraf: Mengoptimalkan bobot dan struktur jaringan saraf.
Pemilihan fitur: Pilih fitur yang paling bermanfaat untuk klasifikasi atau regresi.

4. Implementasi visual dari contoh Python

gambar

Contoh kode berikut mengimplementasikan algoritma genetika untuk memecahkan masalah travelling salesman.旅行商问题(TSP) adalah masalah optimasi kombinatorial klasik yang bertujuan untuk menemukan jalur terpendek bagi seorang salesman keliling untuk mengunjungi setiap kota di kumpulan kota tertentu tepat satu kali dan akhirnya kembali ke kota awal, yaitu meminimalkan total jarak perjalanan atau Biaya, banyak digunakan dalam logistik, penjadwalan produksi dan bidang lainnya.

Kami pertama-tama mendefinisikan semua ibu kota provinsi di Tiongkok (termasukTaipei, ibu kota Provinsi Taiwan di Tiongkok) dan data koordinatnya, dan penggunaannya哈夫曼公式Hitung jarak antara dua titik lalu lewati遗传算法Buat populasi awal, perbanyak, mutasi, dan hasilkan generasi berikutnya, terus optimalkan jalur, dan terakhir catat jarak dan jalur yang sesuai dari jalur terpendek di setiap generasi, temukan jalur terpendek di semua iterasi, dan tampilkan secara visual di petaSemua lokasi kota、Kebugaran berubah dengan jumlah iterasi Selain jalur optimal, hasil akhir menunjukkan jalur terpendek dari Chongqing melewati seluruh kota dan total jaraknya. Sebanyak dua pelatihan dilakukan, nomor iterasi pertama adalah 2000 dan waktu berjalan sekitar 3 menit. Nomor iterasi kedua ditetapkan ke 20000 dan waktu berjalan sekitar 15 menit.

Ringkasnya dalam satu kalimat: mulai dari Chongqing, melakukan perjalanan ke semua ibu kota provinsi di Tiongkok, dan menggunakan algoritma genetika untuk menemukan jalur terpendek. Berikut implementasi kodenya:


import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.basemap import Basemap
import random
from math import radians, sin, cos, sqrt, atan2
 
# 设置随机种子以保证结果可重复
random.seed(42)
np.random.seed(42)
 
# 定义城市和坐标列表，包括台北
cities = {
    "北京": (39.9042, 116.4074),
    "天津": (39.3434, 117.3616),
    "石家庄": (38.0428, 114.5149),
    "太原": (37.8706, 112.5489),
    "呼和浩特": (40.8426, 111.7511),
    "沈阳": (41.8057, 123.4315),
    "长春": (43.8171, 125.3235),
    "哈尔滨": (45.8038, 126.5349),
    "上海": (31.2304, 121.4737),
    "南京": (32.0603, 118.7969),
    "杭州": (30.2741, 120.1551),
    "合肥": (31.8206, 117.2272),
    "福州": (26.0745, 119.2965),
    "南昌": (28.6820, 115.8579),
    "济南": (36.6512, 117.1201),
    "郑州": (34.7466, 113.6254),
    "武汉": (30.5928, 114.3055),
    "长沙": (28.2282, 112.9388),
    "广州": (23.1291, 113.2644),
    "南宁": (22.8170, 108.3665),
    "海口": (20.0174, 110.3492),
    "重庆": (29.5638, 106.5507),
    "成都": (30.5728, 104.0668),
    "贵阳": (26.6477, 106.6302),
    "昆明": (25.0460, 102.7097),
    "拉萨": (29.6520, 91.1721),
    "西安": (34.3416, 108.9398),
    "兰州": (36.0611, 103.8343),
    "西宁": (36.6171, 101.7782),
    "银川": (38.4872, 106.2309),
    "乌鲁木齐": (43.8256, 87.6168),
    "台北": (25.032969, 121.565418)
}
 
# 城市列表和坐标
city_names = list(cities.keys())
locations = np.array(list(cities.values()))
chongqing_index = city_names.index("重庆")
 
# 使用哈夫曼公式计算两点间的距离
def haversine(lat1, lon1, lat2, lon2):
    R = 6371.0  # 地球半径，单位为公里
    dlat = radians(lat2 - lat1)
    dlon = radians(lon1 - lon2)
    a = sin(dlat / 2)**2 + cos(radians(lat1)) * cos(radians(lat2)) * sin(dlon / 2)**2
    c = 2 * atan2(sqrt(a), sqrt(1 - a))
    distance = R * c
    return distance
 
# 计算路径总距离的函数，单位为公里
def calculate_distance(path):
    return sum(haversine(locations[path[i]][0], locations[path[i]][1], locations[path[i + 1]][0], locations[path[i + 1]][1]) for i in range(len(path) - 1))
 
# 创建初始种群
def create_initial_population(size, num_cities):
    population = []
    for _ in range(size):
        individual = random.sample(range(num_cities), num_cities)
        # 确保重庆为起点
        individual.remove(chongqing_index)
        individual.insert(0, chongqing_index)
        population.append(individual)
    return population
 
# 对种群进行排名
def rank_population(population):
    # 按照路径总距离对种群进行排序
    return sorted([(i, calculate_distance(individual)) for i, individual in enumerate(population)], key=lambda x: x[1])
 
# 选择交配池
def select_mating_pool(population, ranked_pop, elite_size):
    # 选择排名前elite_size的个体作为交配池
    return [population[ranked_pop[i][0]] for i in range(elite_size)]
 
# 繁殖新个体
def breed(parent1, parent2):
    # 繁殖两个父母生成新个体
    geneA = int(random.random() * (len(parent1) - 1)) + 1
    geneB = int(random.random() * (len(parent1) - 1)) + 1
    start_gene = min(geneA, geneB)
    end_gene = max(geneA, geneB)
    child = parent1[:start_gene] + parent2[start_gene:end_gene] + parent1[end_gene:]
    child = list(dict.fromkeys(child))
    missing = set(range(len(parent1))) - set(child)
    for m in missing:
        child.append(m)
    # 确保重庆为起点
    child.remove(chongqing_index)
    child.insert(0, chongqing_index)
    return child
 
# 突变个体
def mutate(individual, mutation_rate):
    for swapped in range(1, len(individual) - 1):
        if random.random() < mutation_rate:
            swap_with = int(random.random() * (len(individual) - 1)) + 1
            individual[swapped], individual[swap_with] = individual[swap_with], individual[swapped]
    return individual
 
# 生成下一代
def next_generation(current_gen, elite_size, mutation_rate):
    ranked_pop = rank_population(current_gen)
    mating_pool = select_mating_pool(current_gen, ranked_pop, elite_size)
    children = []
    length = len(mating_pool) - elite_size
    pool = random.sample(mating_pool, len(mating_pool))
    for i in range(elite_size):
        children.append(mating_pool[i])
    for i in range(length):
        child = breed(pool[i], pool[len(mating_pool)-i-1])
        children.append(child)
    next_gen = [mutate(ind, mutation_rate) for ind in children]
    return next_gen
 
# 遗传算法主函数
def genetic_algorithm(population, pop_size, elite_size, mutation_rate, generations):
    pop = create_initial_population(pop_size, len(population))
    progress = [(0, rank_population(pop)[0][1], pop[0])]  # 记录每代的最短距离和代数
    for i in range(generations):
        pop = next_generation(pop, elite_size, mutation_rate)
        best_route_index = rank_population(pop)[0][0]
        best_distance = rank_population(pop)[0][1]
        progress.append((i + 1, best_distance, pop[best_route_index]))
    best_route_index = rank_population(pop)[0][0]
    best_route = pop[best_route_index]
    return best_route, progress
 
# 调整参数
pop_size = 500       # 增加种群大小
elite_size = 100     # 增加精英比例
mutation_rate = 0.005 # 降低突变率
generations = 20000   # 增加迭代次数
 
# 运行遗传算法
best_route, progress = genetic_algorithm(city_names, pop_size, elite_size, mutation_rate, generations)
 
# 找到最短距离及其对应的代数
min_distance = min(progress, key=lambda x: x[1])
best_generation = min_distance[0]
best_distance = min_distance[1]
 
# 图1：地图上显示城市位置
fig1, ax1 = plt.subplots(figsize=(10, 10))
m1 = Basemap(projection='merc', llcrnrlat=18, urcrnrlat=50, llcrnrlon=80, urcrnrlon=135, resolution='l', ax=ax1)
m1.drawcoastlines()
m1.drawcountries()
m1.fillcontinents(color='lightgray', lake_color='aqua')
m1.drawmapboundary(fill_color='aqua')
for i, (lat, lon) in enumerate(locations):
    x, y = m1(lon, lat)
    m1.plot(x, y, 'bo')
    ax1.text(x, y, str(i), fontsize=8)
ax1.set_title('City Locations')
plt.show()
 
# 图2：适应度随迭代次数变化
fig2, ax2 = plt.subplots(figsize=(10, 5))
ax2.plot([x[1] for x in progress])
ax2.set_ylabel('Distance (km)')
ax2.set_xlabel('Generation')
ax2.set_title('Fitness over Iterations')
# 在图中标注最短距离和对应代数
ax2.annotate(f'Gen: {best_generation}nDist: {best_distance:.2f} km', 
             xy=(best_generation, best_distance), 
             xytext=(best_generation, best_distance + 100),
             arrowprops=dict(facecolor='red', shrink=0.05))
plt.show()
 
# 图3：显示最优路径
fig3, ax3 = plt.subplots(figsize=(10, 10))
m2 = Basemap(projection='merc', llcrnrlat=18, urcrnrlat=50, llcrnrlon=80, urcrnrlon=135, resolution='l', ax=ax3)
m2.drawcoastlines()
m2.drawcountries()
m2.fillcontinents(color='lightgray', lake_color='aqua')
m2.drawmapboundary(fill_color='aqua')
 
# 绘制最优路径和有向箭头
for i in range(len(best_route) - 1):
    x1, y1 = m2(locations[best_route[i]][1], locations[best_route[i]][0])
    x2, y2 = m2(locations[best_route[i + 1]][1], locations[best_route[i + 1]][0])
    m2.plot([x1, x2], [y1, y2], color='g', linewidth=1, marker='o')
 
# 只添加一个代表方向的箭头
mid_index = len(best_route) // 2
mid_x1, mid_y1 = m2(locations[best_route[mid_index]][1], locations[best_route[mid_index]][0])
mid_x2, mid_y2 = m2(locations[best_route[mid_index + 1]][1], locations[best_route[mid_index + 1]][0])
ax3.annotate('', xy=(mid_x2, mid_y2), xytext=(mid_x1, mid_y1), arrowprops=dict(facecolor='blue', shrink=0.05))
 
# 在最优路径图上绘制城市位置
for i, (lat, lon) in enumerate(locations):
    x, y = m2(lon, lat)
    m2.plot(x, y, 'bo')
    ax3.text(x, y, str(i), fontsize=8)
 
# 添加起点和终点标记
start_x, start_y = m2(locations[best_route[0]][1], locations[best_route[0]][0])
end_x, end_y = m2(locations[best_route[-1]][1], locations[best_route[-1]][0])
ax3.plot(start_x, start_y, marker='^', color='red', markersize=15, label='Start (Chongqing)')  # 起点
ax3.plot(end_x, end_y, marker='*', color='blue', markersize=15, label='End')   # 终点
 
# 添加总距离的图例
ax3.legend(title=f'Total Distance: {best_distance:.2f} km')
 
ax3.set_title('Optimal Path')
plt.show()