informasi kontak saya
Surat[email protected]
2024-07-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
map adalah kumpulan pasangan nilai kunci yang tidak berurutan dalam format kv
var name map[key_type]value_type
// 方式一
var m map[int]string = map[int]string{}
// 方式二
m := map[int]string{
1 : "老一",
2 : "老二",
3 : "老三",
}
// 方式三:5代表容量,也就是在内存中占用多大的空间,可以省略
m := make(map[int]string,5)
mapName[key] = value
// 假设map名为m,key为int,value为string
m[5] = "老五"
Hapus elemen berdasarkan kunci, dan tidak ada kesalahan yang akan dilaporkan saat menghapus kunci yang tidak ada.
delete(mapName, key)
// 假设map名为m,key为int,value为string
delete(m, 5)
Untuk memodifikasi, Anda dapat langsung mengubah nilai yang sesuai dengan kunci yang ditentukan.
mapName[key] = newValue
// 假设map名为m,key为int,value为string
m[5] = "五"
Dapatkan value sesuai keynya, ok flag bitnya apakah ketemu, typenya Boolean
Jika nilai tidak ditemukan, tidak ada kesalahan yang akan dilaporkan dan nilai null dari tipe yang sesuai akan dikembalikan.
value, ok := mapName[key]
if !ok {
fmt.Println(ok)
}
Catatan: penjelajahan peta tidak berurutan
for key, value := range myMap {
// 处理每对键值
}
// 例子
for i, s := range m {
fmt.Println(i, s)
}
Intisari peta dalam bahasa golang adalah penggunaan
hashmap
diimplementasikan, jadi peta pada dasarnya哈希表
。
哈希表
adalah kegunaan哈希函数
Atur data ke dalam struktur data yang mendukung penyisipan dan pencarian cepat.
哈希函数
, juga dikenal sebagai fungsi hash, adalah fungsi yang mengubah masukan dengan panjang berapa pun (seperti string) menjadi keluaran dengan panjang tetap melalui algoritma hash tertentu. Nilai hash biasanya disimpan dalam bentuk seperti array untuk memastikan kinerja akses nilai hash.
Jika rentang masukan melebihi rentang keluaran yang dipetakan, hal ini dapat menyebabkan masukan yang berbeda mendapatkan keluaran yang sama
哈希冲突
。Biasanya ada dua cara untuk mengatasi masalah ini:
开放地址法
Dan拉链法
Metode alamat terbuka:
Struktur data biasanya diimplementasikan menggunakan array
kekurangan:
Pendekatan ini memerlukan lebih banyak ruang untuk menyelesaikan konflik karena tidak hanya data yang disimpan, namun ruang tambahan juga diperlukan untuk menyelesaikan konflik.
Metode ritsleting (peta bahasa go menggunakan metode ini):
Array dan daftar tertaut biasanya digunakan sebagai struktur data yang mendasarinya
Daftar tertaut yang ditautkan pada indeks array yang berbeda juga disebut keranjang.
type hmap struct {
count int // 当前哈希表中的元素数量,即键值对数量,可用内置函数len()获取
flags uint8 // 标志位,标记map状态和属性的字段,如正在迭代等状态
B uint8 // 表示哈希表桶(buckets)的数量为2的B次方
noverflow uint16 // 溢出桶的大致数量,扩容时会用到
hash0 uint32 // 哈希种子,对key做哈希是加入种子计算哈希值,确保map安全性
buckets unsafe.Pointer // 存储桶数组的指针
oldbuckets unsafe.Pointer // 扩容时用于保存旧桶数组的指针 , 大小为新桶数组的一半
nevacuate uintptr // 扩容时的迁移进度器,迁移桶下标小于此值说明完成迁移
extra *mapextra // 溢出桶的指针,指向mapextra结构体,用于存储一些额外的字段和信息
}
// mapextra 处理桶溢出的结构体
type mapextra struct {
overflow *[]*bmap // 溢出桶数组指针,仅当key和elem非指针时才使用
oldoverflow *[]*bmap // 旧的溢出桶数组指针,仅当key和elem非指针时才使用
nextOverflow *bmap // 下一个可用的溢出桶地址
}
Dalam kode sumber, tipe bmap hanya memiliki satu field tophash.Namun selama kompilasi, kompiler Go akan secara otomatis memasukkan kunci, nilai, dan struktur lain yang sesuai sesuai dengan kode pengguna.
Peta permukaan
type bmap struct {
// tophash generally contains the top byte of the hash value
// for each key in this bucket. If tophash[0] < minTopHash,
// tophash[0] is a bucket evacuation state instead.
tophash [bucketCnt]uint8
// Followed by bucketCnt keys and then bucketCnt elems.
// NOTE: packing all the keys together and then all the elems together makes the
// code a bit more complicated than alternating key/elem/key/elem/... but it allows
// us to eliminate padding which would be needed for, e.g., map[int64]int8.
// Followed by an overflow pointer.
}
bmap sebenarnya
// 编译期间会动态地创建一个新的结构:
type bmap struct {
topbits [8]uint8 // 这里存储哈希值的高八位,用于在确定key的时候快速试错,加快增删改查寻址效率,有时候也叫tophash
keys [8]keytype // 存储key的数组,这里bmap最多存储8个键值对
elems [8]valuetype // 存储value的数组,这里bmap也最多存储8个键值对
...
overflow uintptr // 溢出桶指针
}
Dalam bahasa Go, perluasan peta dilakukan secara otomatis untuk menjaga performa peta.
Pertama, saat menulis, peta dilewatiruntime.mapassign
Tentukan apakah perluasan diperlukan
func mapassign(t *maptype, h *hmap, key unsafe.Pointer) unsafe.Pointer {
...
// If we hit the max load factor or we have too many overflow buckets,
// and we're not already in the middle of growing, start growing.
if !h.growing() && (overLoadFactor(h.count+1, h.B) || tooManyOverflowBuckets(h.noverflow, h.B)) {
hashGrow(t, h)
goto again // Growing the table invalidates everything, so try again
}
...
}
// overLoadFactor reports whether count items placed in 1<<B buckets is over loadFactor.
func overLoadFactor(count int, B uint8) bool {
return count > bucketCnt && uintptr(count) > loadFactorNum*(bucketShift(B)/loadFactorDen)
}
func tooManyOverflowBuckets(noverflow uint16, B uint8) bool {
if B > 15 {
B = 15
}
return noverflow >= uint16(1)<<(B&15)
}
Berdasarkan kode di atas, ada dua kondisi untuk menilai perluasan:
overLoadFactor(h.count+1, h.B)
, faktor beban = jumlah elemen jumlah buckettooManyOverflowBuckets(h.noverflow, h.B))
Metode ekspansi:
Jika faktor beban terlalu besar, maka bucket baru akan dibuat dengan panjang bucket baru dua kali panjang aslinya, lalu data bucket lama akan dipindahkan ke bucket baru.
Datanya tidak banyak, tetapi ada terlalu banyak wadah yang meluap.Selama perluasan, jumlah bucket tetap tidak berubah. Operasi relokasi serupa dengan perluasan tambahan dilakukan lagi, dan pasangan nilai kunci yang longgar disusun ulang untuk meningkatkan penggunaan bucket dan memastikan akses yang lebih cepat.
Langkah-langkah perluasan:
func hashGrow(t *maptype, h *hmap) {
...
// 原有桶设置给oldbuckets
oldbuckets := h.buckets
// 创建新桶
newbuckets, nextOverflow := makeBucketArray(t, h.B+bigger, nil)
flags := h.flags &^ (iterator | oldIterator)
if h.flags&iterator != 0 {
flags |= oldIterator
}
// commit the grow (atomic wrt gc)
h.B += bigger
h.flags = flags
h.oldbuckets = oldbuckets
h.buckets = newbuckets
h.nevacuate = 0
h.noverflow = 0
...
}
// 这个是mapdelete函数中的处理迁移的位置
func mapassign(t *maptype, h *hmap, key unsafe.Pointer) unsafe.Pointer {
...
if h.growing() {
//
growWork(t, h, bucket)
}
...
}
渐进式驱逐
Migrasikan pasangan nilai kunci. Artinya selama perluasan, susunan keranjang lama dan susunan keranjang baru akan ada pada saat yang sama, pasangan nilai kunci yang baru disisipkan akan ditempatkan langsung ke dalam keranjang baru, dan akses ke keranjang lama akan memicu operasi migrasi.// 进入后是一个简单的判断,之后的evacuate是核心逻辑处理,特别多,感兴趣自己看源码
func growWork(t *maptype, h *hmap, bucket uintptr) {
// make sure we evacuate the oldbucket corresponding
// to the bucket we're about to use
evacuate(t, h, bucket&h.oldbucketmask())
// evacuate one more oldbucket to make progress on growing
if h.growing() {
evacuate(t, h, h.nevacuate)
}
}
int
atauint64
。sync.Map
Atau terapkan Peta Anda sendiri yang aman secara bersamaan.