Palavras-chave
cavidade glenoide - instabilidade anterior do ombro - luxação do ombro
Introdução
A avaliação adequada do paciente com instabilidade anterior traumática do ombro permanece um desafio para os ortopedistas.[1] Para o estudo preciso e detalhado das lesões de partes moles e ósseas na instabilidade glenoumeral, exames de tomografia computadorizada com reconstrução 3-D (TC-3D), ressonância magnética (RM) ou artro-ressonância magnética (ARM) são recomendados, o que pode aumentar os custos da propedêutica, retardar o tratamento e burocratizar a conduta por parte do médico assistente.[2]
A observação da interação dinâmica entre as perdas ósseas do úmero proximal e da glenoide na luxação anterior traumática do ombro - bipolaridade das lesões - foi descrita na TC-3D através do conceito glenoid track (GT). O mesmo tem ganhado destaque no meio científico pela sua capacidade prognóstica e por orientar o tratamento adequado de acordo com a classificação da lesão de Hill-Sachs (LHS) e o tamanho da perda óssea da glenoide (POG).[3]
Considerando esse método como ideal e buscando diminuir custos com a avaliação simultânea das lesões de partes moles e ósseas em um único exame, a literatura ortopédica tem investido esforços para substituir a TC-3D pela RM/ARM.[3]
[4]
[5] Nesse sentido, o objetivo do presente estudo é comparar a avaliação do método GT realizada por cirurgiões de ombro utilizando RM/ARM, com a avaliação realizada por um médico radiologista utilizando TC-3D. Como hipótese, acreditamos que a aferição do GT na RM/ARM pode ser realizada de forma acurada e confiável por cirurgiões em sua prática clínica.
Material
Trata-se de um estudo transversal, analítico de 43 pacientes, 44 ombros, selecionados em método não probabilístico – amostragem por conveniência – com diagnóstico de instabilidade anterior traumática do ombro, atendidos no período de março de 2015 a setembro de 2018. Todos os pacientes foram submetidos a exames de TC-3D, RM e/ou ARM em uma única clínica de radiologia.
O cálculo do GT, IHS, da POG e a classificação das lesões em on-track/off-track foi realizada em todos exames de TC-3D por apenas um médico radiologista (R), com mais de 10 anos de experiência na área musculoesquelética. Esta análise foi considerada o padrão de referência.
Três cirurgiões especialistas em ombro (C1, C2 e C3), capacitados para o método GT, realizaram os mesmos cálculos em exames de RM ou ARM. Todos foram cegados para os resultados obtidos por R e para os resultados dos demais avaliadores. Todos os cálculos foram realizados em um só momento e registrados por dois médicos residentes especialistas em cirurgia do ombro (R4).
Não foram consideradas as variáveis gênero, idade e dominância. Foram incluídos pacientes com diagnóstico clínico e radiológico de instabilidade anterior traumática do ombro, com documentação completa de exames de TC-3D, RM e/ou ARM e que não realizaram tratamento cirúrgico até o momento da análise dos dados. Pacientes com exames realizados em outras clínicas radiológicas, avaliados por outro radiologista, com informações incompletas e lesões associadas como fraturas, lesões do manguito rotador ou artrose glenoumeral foram excluídos.
Métodos
Todos os pacientes realizaram a TC-3D em um scanner Siemens Somatom Sensation de 64 canais (Siemens AG, Munique, Alemanha) ou Siemens Somatom Definition AS de 128 canais (Siemens AG), em posição supina e com o membro avaliado em rotação neutra.
Os exames de RM e ARM (Magnetom Essenza 1,5 T - Siemens Healthcare, Erlangen, Alemanha) foram realizados, em decúbito dorsal, com o ombro em rotação neutra, sendo usadas sequências ponderadas em T2 sem ou com supressão de gordura (TR/TE 2280/42, FOV 160 × 100 mm, matriz 384 × 70, espessura de 3 mm), no plano axial, sagital e coronal pós-processadas (Kodak Carestream PACS, Belo Horizonte, Minas Gerais, Brasil).
O cálculo das variáveis GT, do IHS, da POG e a classificação on-track/off-track foi realizada em exames de TC-3D conforme descrito por Di Giacomo et al.[3] ([Figura 1A] e [1B]. O mesmo cálculo foi realizado em exames de RM/ARM seguindo a técnica descrita por Guyftpoulos et al.[4] ([Figura 2A] e [2B]). O GT foi calculado utilizando a fórmula GT = 0,83D – d.
Fig. 1 Imagens tomográficas computadorizadas tridimensionais demonstrando o cálculo do glenoid track (GT). (1A) O intervalo do Hill-Sachs (IHS) corresponde à distância entre a margem interna do footprint do manguito rotador e a borda medial do defeito ósseo. (1B) A partir de um círculo virtual traçado nos dois terços inferiores da glenoide, tendo como referência suas bordas íntegras, obtemos a medida de qual seria o diâmetro da mesma, na ausência de defeito ósseo (D) e da largura do defeito ósseo (d). O GT corresponde 83% do diâmetro glenoidal menos o valor do defeito ósseo.
Fig. 2 Imagens de artro-ressonância demonstrando a medida do glenoid-track (GT). Para o cálculo do GT, o diâmetro (D) da glenoide inferior foi obtido por meio de um círculo desenhado ao longo da glenoide inferior. O comprimento da perda óssea da glenoide (d) foi então aferido. O glenoid-track foi calculado utilizando a fórmula GT = 0,83D – d. (2A) Medida do intervalo de Hill-Sachs utilizando uma vista posterior da cabeça umeral. (2B) Cálculo do GT semelhante ao realizado nas imagens de tomografia computadorizada.
A análise dos dados foi realizada no programa IBM SPSS versão 23.0. (IBM Corp., Armonk, NY, EUA). O nível de significância utilizado em todo estudo foi de 5%. Este estudo foi aprovado pelo Comitê de Ética em Pesquisa da instituição.
Resultado
Análise descritiva
Nenhum dos 44 ombros da amostra foi excluído do estudo. Todos foram submetidos a exames de TC-3D, com 19 (43,2%) submetidos adicionalmente a exames de RM, e 25 (56,8%) exames de ARM. Vinte e quatro ombros (65,9%) foram classificados como on-track e 20 (45,5%) como off-track pelo examinador R em exames de TC-3D. O resultado dos 4 avaliadores foi totalmente concordante em 61,4% dos casos ([Tabela 1]).
Tabela 1
Variável
|
Frequência
|
%
|
Exame de imagem realizado
|
|
|
TC
|
44
|
100,0
|
RM
|
19
|
43,2
|
ARM
|
25
|
56,8
|
Resultado – R
|
|
|
On-track
|
24
|
54,5
|
Off-track
|
20
|
45,5
|
Resultado – C1
|
|
|
On-track
|
29
|
65,9
|
Off-track
|
15
|
34,1
|
Resultado – C2
|
|
|
On-track
|
31
|
70,5
|
Off-track
|
13
|
29,5
|
Resultado – C3
|
|
|
On-track
|
36
|
81,8
|
Off-track
|
8
|
18,2
|
Discordância
|
|
|
0
|
27
|
61,4
|
1
|
7
|
15,9
|
2
|
5
|
11,4
|
3
|
5
|
11,4
|
Total
|
44
|
100,0
|
Análise de variância
Para avaliar a variação dos resultados do GT, IHS e POG em relação aos quatro examinadores, foram aplicados os testes de Kolmogorov-Smirnov, de Levene, Posthoc de Dunnet e o Dunnet T3.
Foi comprovado diferença estatística significativa nos valores de GT, IHS e POG quando se compararam os quatro examinadores. A maior variabilidade de dados ocorreu para a variável IHS. A média dos valores do IHS na RM/ARM foram menores quando comparado com a TC-3D ([Tabelas 2] e [3]).
Tabela 2
|
n
|
Média
|
Mediana
|
Desvio padrão
|
Mínimo
|
Máximo
|
Amplitude interquartil
|
Examinador R
GT
|
44
|
20,30
|
20,27
|
2,50
|
12,98
|
27,39
|
3,13
|
IHS
|
44
|
19,64
|
20,21
|
3,61
|
11,32
|
29,01
|
4,17
|
POG
|
44
|
8,68
|
9,50
|
7,65
|
0,00
|
33,00
|
14,00
|
Examinador C1
GT
|
44
|
20,00
|
19,98
|
3,71
|
2,46
|
26,08
|
3,18
|
IHS
|
44
|
17,36
|
18,35
|
5,72
|
6,35
|
33,84
|
8,16
|
POG
|
44
|
11,63
|
11,50
|
7,12
|
0,00
|
33,00
|
7,58
|
Examinador C2
GT
|
44
|
20,60
|
20,68
|
2,73
|
12,08
|
25,04
|
4,00
|
IHS
|
44
|
16,62
|
16,10
|
5,39
|
3,78
|
29,82
|
5,70
|
POG
|
44
|
7,83
|
0,00
|
9,19
|
0,00
|
30,53
|
15,43
|
Examinador C3
GT
|
44
|
21,95
|
22,13
|
2,81
|
15,49
|
30,52
|
3,55
|
IHS
|
44
|
15,69
|
14,51
|
5,30
|
4,79
|
29,35
|
6,46
|
POG
|
44
|
7,21
|
7,00
|
7,25
|
0,00
|
22,00
|
13,00
|
Tabela 3
|
n
|
Média
|
Desvio padrão
|
Erro padrão
|
Intervalo de confiança de 95% para média
|
Mínimo
|
Máximo
|
Limite inferior
|
Limite superior
|
GT
|
R
|
44
|
20,30
|
2,50
|
0,38
|
19,54
|
21,06
|
12,98
|
27,39
|
C1
|
44
|
20,00
|
3,71
|
0,56
|
18,87
|
21,13
|
2,46
|
26,08
|
C2
|
44
|
20,60
|
2,73
|
0,41
|
19,76
|
21,43
|
12,08
|
25,04
|
C3
|
44
|
21,95
|
2,81
|
0,42
|
21,10
|
22,81
|
15,49
|
30,52
|
Total
|
176
|
20,71
|
3,04
|
0,23
|
20,26
|
21,17
|
2,46
|
30,52
|
IHS
|
R
|
44
|
19,64
|
3,61
|
0,54
|
18,55
|
20,74
|
11,32
|
29,01
|
C1
|
44
|
17,36
|
5,72
|
0,86
|
15,62
|
19,10
|
6,35
|
33,84
|
C2
|
44
|
16,62
|
5,39
|
0,81
|
14,98
|
18,26
|
3,78
|
29,82
|
C3
|
44
|
15,69
|
5,30
|
0,80
|
14,08
|
17,30
|
4,79
|
29,35
|
Total
|
176
|
17,33
|
5,24
|
0,39
|
16,55
|
18,11
|
3,78
|
33,84
|
POG
|
R
|
44
|
8,68
|
7,65
|
1,15
|
6,36
|
11,01
|
0,00
|
33,00
|
C1
|
44
|
11,63
|
7,12
|
1,07
|
9,46
|
13,79
|
0,00
|
33,00
|
C2
|
44
|
7,83
|
9,19
|
1,39
|
5,03
|
10,62
|
0,00
|
30,53
|
C3
|
44
|
7,21
|
7,25
|
1,09
|
5,01
|
9,41
|
0,00
|
22,00
|
Total
|
176
|
8,84
|
7,96
|
0,60
|
7,65
|
10,02
|
0,00
|
33,00
|
O Posthoc para a variável GT teve como resultado uma diferença estatisticamente significativa entre os examinadores R e C3 (P = 0,027) e entre os examinadores C1 e C3 (P = 0,039), sendo que os valores encontrados por C3 foram significativamente maiores que os outros dois.
Para a variável IHS o resultado foi de diferença significativa entre os examinadores R e C2 (P = 0,017) e entre os examinadores R e C3 (P = 0,001), sendo que os valores encontrados por R foram significativamente maiores.
Já para a POG foi encontrada diferença entre os examinadores C1 e C3 (P = 0,027), onde os valores encontrados por C1 foram significativamente maiores em comparação aos valores obtidos por C3.
Análise de associação da discordância de resultados
Para a avaliação das variáveis quantitativas, foi realizada uma análise de correlação não paramétrica. Para isso os resultados de R foram sempre considerados corretos e o número de discordâncias desse resultado foi avaliado (0–3 discordâncias). O teste utilizado foi a correlação de Spearman.
Houve correlação estatisticamente significativa entre IHS e a POG, ambas com coeficiente positivo, indicando que valores maiores de IHS e POG foram associados a mais discordâncias entre os examinadores ([Tabela 4]).
Tabela 4
Correlações
|
|
IHS
|
POG
|
Discordância
|
ρ de Spearman
|
GT
|
Coeficiente de correlação
|
0,154
|
−0,565
|
−0,264
|
P
|
0,320
|
0,000
|
0,084
|
n
|
44
|
44
|
44
|
IHS
|
Coeficiente de correlação
|
1,000
|
0,177
|
0,434
|
P
|
|
0,249
|
0,003
|
n
|
44
|
44
|
44
|
POG
|
Coeficiente de correlação
|
|
|
0,334
|
P
|
|
|
0,027
|
n
|
|
|
44
|
Para a avaliação das variáveis qualitativas utilizou-se o teste Qui-quadrado de Pearson. Observa-se que 88,24% das discordâncias foram para as lesões off-track. Isso demonstra que a maior dificuldade ocorreu no diagnóstico por RM/ARM das lesões do tipo off-track calculadas por TC-3D.
Análise de concordância
Observa-se que os valores de sensibilidade não foram muito altos variando de 35 a 65% ([Tabela 5]). Em todos os casos o coeficiente Kappa foi estatisticamente significativo. O coeficiente Kappa é utilizado para descrever a concordância entre dois ou mais testes, variando de 0 a 1. Valores próximos de 0 indicam baixa concordância e valores próximos a 1, alta concordância. O índice de Kappa variou de 0,325 a 0,579. Isso significa que o método GT utilizando imagens de RM/ARM apresentou apenas moderada capacidade de identificar pacientes com lesão off-track diagnosticadas por imagens de TC-3D.
Tabela 5
|
C1
|
C2
|
C3
|
Índice Kappa
|
0,579
|
0,575
|
0,325
|
Sensibilidade (%)
|
65,00
|
60,00
|
35,00
|
Especificidade (%)
|
91,67
|
95,83
|
95,83
|
Valor preditivo positivo (%)
|
86,67
|
92,31
|
87,50
|
Valor preditivo negativo (%)
|
75,86
|
74,19
|
63,89
|
Razão de verossimilhança positiva
|
7,80
|
14,39
|
8,39
|
Razão de verossimilhança negativa
|
0,38
|
0,42
|
0,68
|
Acurácia
|
79,5
|
79,5
|
68,1
|
Valor de p
|
< 0,001
|
< 0,001
|
0,014
|
O valor preditivo positivo (VPP) variou de 86,67 a 92,31%. O valor preditivo negativo (VPN), variou de 63,89 a 75,86%. A acurácia diagnóstica para lesões off-track variou de 68,1 a 79,5% entre os examinadores.
Curva COR
Observa-se pelos resultados da curva característica de operação do receptor (COR) que apenas a avaliação de C3 não foi estatisticamente eficiente no diagnóstico de lesões off-track (P > 0,05) ([Figura 3]). O melhor resultado foi o da classificação realizada por C1, o qual obteve a maior área sob a curva. Quanto melhor o teste, mais a área sob a curva COR se aproxima de 1.
Fig. 3 Curvas características de operação do receptor (COR) dos examinadores cirurgiões (C1, C2 e C3) no diagnóstico por RM/ARM de lesões on-track/off-track. O resultado do cálculo da área sob a curva COR para os três examinadores foi: área = 0,783, P = 0,001 para o examinador C1; área = 0,779, P = 0,002 para o examinador C2 e área = 0,654, P = 0,081 para o examinador C3.
Discussão
Historicamente os estudos sobre instabilidade anterior do ombro focaram na POG, ocorrida durante o episódio de luxação do ombro, também chamada lesão de Bankart ósseo (LBO).[6]
[7] É amplamente aceito que este dano estrutural altera a biomecânica da glenoide ao prejudicar sua função de estabilizador estático.[8] Defeitos maiores que 20 a 25% merecem especial atenção por apresentarem pior prognóstico com o reparo artroscópico.[6]
[9]
Quando o ombro sofre luxação anterior uma fratura por impacção pode ocorrer na porção póstero-superior e lateral da cabeça umeral. Esta lesão é definida como lesão de Hill-Sachs e está presente em até 70% das luxações primárias do ombro.[10]
[11] Estudos revelam que defeitos ósseos com 5/8 do raio da cabeça umeral já seriam capazes de alterar a instabilidade do ombro.[12]
Embora já demonstrado a importância da LHS e da LBO na biomecânica do ombro, a descrição do método GT permitiu a compreensão da interação dinâmica entre estas lesões ósseas.[13] Atualmente, o método GT faz parte da rotina da maioria dos serviços de ortopedia, por sua capacidade prognóstica na avaliação das LHS e por ser capaz de orientar o tratamento da instabilidade anterior do ombro.[3]
A mensuração do GT e POG foi originalmente descrita para exames de TC-3D com o intuito de prever lesões do tipo engage.[3]
[13] Contudo, em busca de reduzir os custos, bem como a exposição à radiação, pesquisadores tem estudado o uso da RM/ARM para este objetivo.[1]
[4]
[14]
O conceito de engagement foi inicialmente proposto por Burkhart e De Beer[7] para explicar fatores relacionados a recidiva da instabilidade após a cirurgia de Bankart artroscópica. Pacientes com estas lesões, com o ombro abduzido e em rotação lateral estariam predispostos ao “encaixe” da LHS na borda anterior da glenoide levando à instabilidade articular. Lesões engage correspondem às lesões off-track no método GT.[3]
Gyftopoulos et al.,[4] com a intenção de viabilizar o método glenoid-track para a RM, classificaram o GT em 75 ombros e compararam o resultado com achados descritos de engagement durante a artroscopia. Concluíram que a RM apresenta sensibilidade de 72,2% no diagnóstico de lesões engage (off-track), especificidade de 87,9% para lesões não engage (on-track), e acurácia geral de 84,2%. O VPP foi de 65% e o VPN de 91,1%.
No presente estudo a RM/ARM diagnosticou lesões off-track com a sensibilidade variando de 35 a 65% entre os cirurgiões, e lesões on-track com a especificidade variando de 91,67 a 95,83%. A acurácia para o diagnóstico de lesões off-track variou de 68,1 a 79,5%. O VPP apresentou ao menos 86,67% de chance de identificar pacientes verdadeiramente off-track, enquanto o VPN apresentou ao menos 63,89% de chance de identificar pacientes verdadeiramente positivos para lesões on-track. Em todos os casos o coeficiente Kappa foi significativo. Estes resultados são inferiores a aqueles demonstrados por Gyftopoulos et al.[4]
Schneider et al.[15] avaliaram a variação da medida do GT intra e interobservadores em 71 pacientes com exames de TC-3D. Demonstraram que a avaliação da POG apresenta boa concordância intra e interobservadores (94% e 96%, respectivamente). Contudo, um nível de confiabilidade de apenas 72% foi conseguido entre os examinadores na classificação on-track e off-track, considerado baixo pelos autores. Concluíram que a POG apresenta melhores níveis de reprodutibilidade e confiabilidade que a avaliação da LHS.
Nossos resultados demonstraram que a maior variabilidade dos dados ocorreu para o cálculo do IHS nos exames de RM/ARM, o mesmo demonstrado pelo estudo de Schnieder et al.[15] em exames de TC-3D. Além disso, concluímos que a RM/ARM tende a apresentar menores valores de IHS quando comparado com a TC-3D. Várias etapas são necessárias para a avaliação adequada da LHS, em nossa opinião, e cada uma apresenta potencial de erro, o que leva à baixa confiabilidade e reprodutibilidade que a literatura tem demonstrado.
Funakoshi et al.[16] avaliaram a concordância da classificação do GT entre exames de TC-3D e medidas realizadas intraoperatório em artroscopias. Dos 16 ombros classificados em on ou off-track, apenas 10 apresentaram concordância entre os 2 métodos (63%, Kappa = 0,16). Todos os casos que discordaram foram calculados como on-track pela TC-3D e off-track pela atroscopia. Concluíram que valores maiores de GT são medidos na TC-3D, quando comparados com a artroscopia, sendo responsáveis por toda discrepância e pela baixa concordância entre os métodos encontrada no estudo.
Nossos resultados revelaram moderada concordância na classificação on-track/off-track entre exames de TC-3D e RM/ARM (Kappa 0,325–0,579). Em nosso estudo a maioria dos resultados discordantes (15 de 17 resultados, ou 88,24%) foram classificados como off-track pela TC-3D e on-track pela RM/ARM, o que poderia repercutir com uma abordagem inadequada da LHS, aumentando o risco de recidiva da instabilidade. Os resultados dos 4 examinadores foram totalmente concordantes em 27 dos 44 ombros (61,4%) para a classificação on-track/off-track. Fato interessante é que valores maiores de IHS e de POG foram associados a maior discrepância entre os examinadores. Acreditamos que este fato pode ser explicado pela dificuldade dos avaliadores em selecionar as imagens mais representativas das referidas lesões ósseas, especialmente na RM/ARM que possibilita análise da imagem em apenas duas dimensões espaciais ao contrário da TC.
Ao avaliar os resultados do cirurgião 3, observamos que este apresentou a maior média de valores de GT e foi o único a não apresentar eficiência estatística com a curva COR. Talvez por isso tenha apresentado a menor concordância dentre os examinadores (Kappa = 0,325).
De nosso conhecimento, o presente estudo é o primeiro a comparar o método GT entre medidas na TC-3D com as medidas na RM/ARM. Apesar dos estudos disponíveis usarem diferentes modalidades para a comparação do método GT, nossos resultados se aproximam muito daqueles publicados na literatura.
Evidentemente, a utilização da RM/ARM na classificação do GT não é uma técnica perfeita. Como evidenciado nos resultados, a RM/ARM tende a apresentar menores valores de IHS. Nesse caso, acreditamos que a avaliação realizada pela TC-3D superestima os resultados por ser incapaz de identificar o ponto exato de inserção do tendão infraespinal, utilizado como referência para mensuração. Esta pode ser a explicação para a dificuldade da RM/ARM em identificar lesões off-track diagnosticadas pela TC-3D em nosso estudo. Este dado tem grande relevância pois, conforme descrito previamente, essas lesões devem ser abordadas pela técnica de remplissage para reduzir as chances de recidiva da luxação anterior do ombro.[3]
As razões da falha diagnóstica na classificação do GT já foram discutidas na literatura e podem estar relacionadas a variações inter e intraobservador, falha em determinar o ponto de inserção do manguito rotador no cálculo do IHS, falha em determinar a borda medial da LHS e falha em determinar o limite da POG. A estimativa do GT (componente mais importante da técnica) já foi citada como tecnicamente difícil e desafiadora.[4]
[5]
As limitações deste estudo incluem sua natureza transversal, assim como a amostragem limitada, realizada por método não probabilístico, atribuída principalmente ao custo de se realizar exames de tomografia computadorizada (TC) e RM/ARM. A avaliação realizada por cirurgiões, e não apenas radiologistas, e a ausência de avaliações seriadas das mesmas imagens constituem viés de aferição.
Conclusão
O método GT realizado em RM/ARM revelou baixa acurácia e moderada concordância no diagnóstico de lesões on-track/off-track, quando comparado com a TC-3D. No que diz respeito ao cálculo do IHS, a definição da borda medial do tendão infraespinal e a borda medial da LHS deve ser instituída com atenção, uma vez que as maiores divergências dos dados ocorreram para esta medida. A RM/ARM tende a apresentar menores valores de IHS. A maior dificuldade do estudo envolveu o diagnóstico por RM/ARM de lesões off-track calculados pela TC-3D. Exames de RM/ARM devem ser utilizados de forma cautelosa por cirurgiões de ombro no cálculo do glenoid-track.