Compartilhamento de tecnologia

Visual SLAM e posicionamento – pontos de recurso front-end e correspondência

2024-07-12

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Artigo de referência ou link

Correspondência de imagens de recursos artesanais a profundos: uma pesquisa
Correspondência de imagens em amplas linhas de base: do papel à prática
Técnicas de registro de imagens: uma pesquisa
Posicionamento visual baseado em mapa

Avaliação do desempenho do ponto característico

Artigos de referência:

Repetibilidade
Erro médio de detecção de canto
Erro de posicionamento de canto

Resumindo, um bom extrator de pontos característicos pode extrair de forma estável e precisa pontos 2D formados pela projeção de pontos 3D no mesmo espaço na imagem sob diferentes condições de mudança (como ângulo de visão, iluminação, etc.).

Pontos de recursos e descritores tradicionais (apenas pontos de recursos ou pontos de recursos + descritores)

Os pontos de características visuais foram originalmente projetados com base no pensamento dos pesquisadores, como SIFT, SURF, ORB e Harris, etc. Eles também foram usados ​​​​em golpes visuais ou posicionamento durante o mesmo período.
[Harris
,1988] VINHO
[Shi-Tomasi, 1994] MonoSLAM
[RÁPIDO
,1998] ORB_SLAM, T265 VIOMSCKF-VIO, OpenVSLAM, OKVIS, ROVIO, PTAM
[Blob e Canto]BATER SOFT
[PENEIRAR
, 1999] MSCKF
[DOIDO,2012] Localização assistida por visão para robôs terrestres

descritor tradicional

[APRESENTAÇÃO, 2010] é frequentemente usado em conjunto com pontos de canto rápidos, comoORB_SLAMLDSOespere
[RÁPIDO, 2011]: Uma melhoria do BRIEF com invariância de escala e rotação

Limitações dos descritores tradicionais: Eles são projetados com base nos sentimentos humanos e não são específicos o suficiente para computadores. Por exemplo, eles não conseguem lidar com mudanças nos ângulos de iluminação e outras alterações.

Pontos de recursos baseados em aprendizado profundo

CovDet
Quad-redes
Rede de Afiliados
Rede Chave
Ponto Mágico

Descritores baseados em aprendizagem profunda

L2Net: Novos modos e erros de amostragem, CVPR2017
DeepCD: Descritores de ponto flutuante e descritores binários são complementares, ICCV2017
Spread-out: Aprendendo a distribuição espacial dos descritores, ICCV2017
HardNet: erro aprimorado baseado em L2Net, NIPS2017
SoSNet: descritor de aprendizagem baseado na regularização de similaridade de segunda ordem, CVPR2019
GIFT: Usando conjuntos de convolução de grupo para aprender descritores com certa invariância de escala e rotação, NIPS2019
S2DNet: Converta o aprendizado do descritor em um problema de classificação e treine do esparso para o denso, ECCV2020
CAPS: Aprendizagem de descritores usando apenas restrições epipolares.

Pontos de recurso + descritores baseados em aprendizado profundo

SuperPonto: Ponto de característica auto-supervisionado e aprendizagem de descritor, com certa robustez à iluminação, DX-SLAM, CVPR2018
ELEVADOR: Transformação de recursos invariantes baseada em aprendizagem, 2016:
DISCO: Use o método de gradiente de política na aprendizagem por reforço para aprender a extração e descrição de recursos, que tem certa robustez para áreas fracas de artes e ciências, NIPS2020
R2D2: Proposto para a repetibilidade e confiabilidade de pontos característicos, NeurIPS2019
D2Net: Recursos locais detectam e descrevem em conjunto CNN treinável, CVPR2019
Característica ASL: Aprendizagem de descritores locais para formato e posicionamento precisos, CVPR2020

Pontos de características e descritores baseados em aprendizagem profunda são frequentemente propostos para resolver as deficiências dos métodos tradicionais em aplicações práticas e são mais robustos à iluminação, ângulos de visão, etc.

correspondência de recursos

Correspondência Knn do vizinho mais próximo
Algoritmo de correspondência FLANN
GMS: Explorando informações de suavização de movimento para correspondência de recursos rápida e robusta, CVPR2017
AdaLAM: Um algoritmo de eliminação de correspondência de erros que leva em consideração a distribuição de pontos correspondentes e a consistência afim, e a imagem é dividida em blocos com base na transformação afim RANSAC
Redes SGM: Correspondência semiglobal usando redes neurais, CVPR2017
PointCN: Após a correspondência de força bruta, use o perceptron multicamadas para propor a correspondência de erros, CVPR2018
Jogo SuperCola: Correspondência robusta baseada em rede neural gráfica e mecanismo de atenção, CVPR2020
LoFTR: Usando o Transformer para correspondência de recursos locais sem extrator de recursos, CVPR2021