sexta-feira, 9 de janeiro de 2015

Resumo do Artigo "A Comparative Study of Staff Removal Algorithms"

O artigo "A Comparative Study of Staff Removal Algorithms" de Dalitz et al. apresenta um novo método para remoção de compasso em imagens de partituras e faz um estudo comparativo de diversos algoritmos da literatura. O estudo é baseado na deformação de um conjunto de imagens sintéticas usando diversos modelos que simulam condições reais de digitalização. Os autores buscam avaliar se existe um algoritmo que é mais robusto em todos os contextos.

Primeiramente, o artigo apresenta um esquema genérico de detecção de compasso (sem o objetivo de remoção) que resulta em uma aproximação poligonal das linhas. Para permitir o uso desta técnica com algoritmos de remoção de compasso o algoritmo genérico é modificado para estimar um "esqueleto" de cada linha do compasso. Este algoritmo é utilizado no restante do artigo como detector de linhas de compasso (para os algoritmos que necessitam de uma etapa de detecção).

Em seguida os autores fazem uma categorizam diversos algoritmos da área em quatro categorias:
  1. Line Tracking: algoritmos que primeiro detectam as linhas do compasso e depois removem os pixeis em torno de cada uma das linhas. O critério usado para remoção muda conforme o método; Refs [3][16] e [19] do artigo.
  2. Vector Fields: algoritmos deste tipo calculam, para cada pixel preto da imagem, um vetor cujo ângulo e comprimento é baseado no maior segmento de reta que contém somente pontos pretos; Ref [15] do artigo.
  3. Runlength Analysis: estes algoritmos consideram somente as sequências de pontos verticais e/ou horizontais de mesma cor (runlengths) e analisam a vizinhança de cada runlength para decidir se ela pertence ou não a uma linha do compasso; Refs [14] e [17] do artigo.
  4. Skeletonization: algoritmos que utilizam o esqueleto da imagem de partitura para decidir se um pixel é ou não parte de uma linha. O método apresentado pelos autores se encaixa nesta categoria. Ref [18] do artigo.

A última parte do artigo consiste na comparação entre os diversos algoritmos apresentados. As imagens foram geradas em programas de notação musical e posteriormente deformadas usando 10 modelos diferentes (Figura 1). Como as imagens foram geradas sinteticamente, é possível extrair o compasso delas a partir do arquivo gerado. Desta maneira, os datasets deformados são criados deformando simultaneamente a imagem de entrada (com as linhas) e a imagem de saída (sem as linhas).


A avaliação dos métodos é feita utilizando três medidas de erro diferentes (entre elas a comparação de pixels "pura") e usando o teste estatístico descrito em [Mao1999]. Todo o software e imagens usados estão disponíveis na página do MusicStaves.

Para as imagens originais "perfeitas", não existe nenhum algoritmo que obtém resultados significativamente melhores que os outros. Para o restante das deformações, o algoritmo apresentado pelos autores só não obteve o melhor desempenho na deformação Typeset Emulation.





(a) Original image.

(b) Curvature.

(c) Thickness.

(d) White speckles.

(e) Interruptions.

(f) Typeset.

(g) Kanungo

(h) Y-Variation.

(i) Rotation.
Figure 1. Deformations used to test the robustness of staff removal methods.




Referência completa: C. Dalitz, M. Droettboom, B. Pranzas, and I. Fujinaga, “A comparative study of staff removal algorithms,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 30, no. 5, pp. 753–766, 2008.  [Download]

[Mao1999] Song Mao and Tapas Kanungo. 2001. Empirical Performance Evaluation Methodology and Its Application to Page Segmentation Algorithms. IEEE Trans. Pattern Anal. Mach. Intell. 23, 3 (March 2001), 242-256. DOI=10.1109/34.910877 [Download]