martes, 18 de marzo de 2014

Sistema Soundex



EL Sistema Soundex es un método de archivo por código que da un número a cada apellido y que agrupa apellidos similares, sin tener en cuenta la forma en que se deletrean. La primera letra de un apellido nunca se codifica.  Esta letra siempre va seguida por tres dígitos que están determinados por la aplicación del Código Soundex.    
En este sistema hay seis grupos de letras consonantes, cada una de las cuales tienen un número equivalente. La tabla que se presenta a continuación muestra el Código Soundex:

Letras

Números equivalentes
b, f, p, v

1
c, ch, g, j, k, q, s, x, z

2
d, t

3
l, ll

4
m, n, ñ

5
r

6
No codificados o sin codificar

0
Insuficientes consonantes

0

Es fácil recordar que casi todas las consonantes son codificadas, menos las letras W, H, Y, y todas las vocales: a, e, i, o, u, no son codificadas, por lo tanto las tres consonantes y las vocales no tienen numero equivalentes                          

Reglas para codificación:

1.- a.- La primera letra del apellido es la letra inicial y ella, indica, la sección de fichero a la, cual, pertenece, el apellido. (El apellido Rodríguez, será archivado en la  sección “R” y Suárez en la "sección “S”.

El resto del apellido será codificado con tres dígitos en la secuencia en que las consonantes codificables se encuentran en el apellido.

Rodríguez    se codifica       R – 362

La primera letra de este apellido es “R” Y como es la letra inicial no se codifica. La próxima letra es “d” que en la tabla tiene un equivalente de “3”.  La próxima es “r” que tiene un equivalente de “6”. La siguiente letra es “i” que es una vocal y no se codifica. La próxima letra es “g” y su equivalente es “2”. Se codifica e nombre hasta llegar a tres dígitos. Ningún código tiene más de tres dígitos.

R o d r í g u e z        
=
R- 362
G u t i é rr e z
=
G- 362
P e d r a z a            
=
P- 362

Esto demuestra que el mismo código 362 puede ser usado para las 29 secciones alfabéticas del fichero:

b.- Cuando no hay consonantes o cuando las que se pueden codificar son menos de 3, se agrega un cero, dos ceros o tres ceros para completar el código.

G o r r o n d o n a      se codifica:       G- 653  (solamente 3 consonantes)
D u a r t e             se codifica:       D- 630  (2 consonantes, se agregan 1 cero)
L u q u e             se codifica:       L- 200   (1 consonantes, agregar 2 ceros)
R o a se codifica:       R- 000   (no hay consonantes, se agregan 3 ceros.)











2.- a.- Cuando un apellido tiene doble consonante considérelas para el fin de codificar como si fueran una sola consonante.
Ejemplos.

R a z e t t i
se codifica:     
R- 230
V i c c i
se codifica:     
V- 200
C a r r e ñ o
se codifica:     
C- 650
R o a
se codifica:     
G- 450

 b. Cuando el apellido tiene cualquier combinación de dos o más consonantes juntas con el mismo equivalente numérico, se codifican como una sola consonante.
Ejemplo:

C a r r a s c o
se codifica:     
G- 620
C a r r a s q u e l
se codifica:     
C- 624

3.- a.- Las vocales a, e, i, o, u y la consonante “y” son usadas como separadores. Las consonantes que tienen un mismo código se codifican individualmente cuando están separadas por estas vocal

P e r e i r a
se codifica:     
P-660
F e r r e r o
se codifica:     
F-660
M o r e i r a
se codifica:     
M-660
V i ll a l o b o s
se codifica:     
V-441
C a m i n o
se codifica:     
C-550

b.- Cuando una o más letras se siguen inmediatamente a la letra inicial tiene el mismo equivalente numérico que ella, no se codifica sino que se sigue por el apellido hasta llegar a la primera consonante que tiene código.  Esta  regla se aplica a cualquier letra que siga inmediata­mente a la letra inicial y sus equivalentes sin separadoras.
Se encuentran ejemplos en apellidos que comienzan con las letras C, G, P y más frecuentemente en apellidos que comi­enzan con las letras S. Note en el siguiente ejemplo que las su­brayadas como una  unidad tiene el mismo equivalente nu­mérico que la letra “inicial” del nombre y no tienen separadoras y por eso no se codifican.
Ejemplo:

S c o t t
se codifica:     
S-300
S ch i ll e r
se codifica:     
S-460

b.-  Las letras h, y w que aparecen dentro del apellido se deben ignorar. No se codifican ni se consideran como separadoras. Se deben considerar como si no existieran,  en el apellido.

H a w k i n s
se codifica:     
H-252
L e w i s
se codifica:     
L-200
S a c h s
se codifica:     
S-200
L  e  y  v  a
se codifica:     
L-100

4.- Partículas como ben, d, da, de, del, el, la, las, le,li, lo, los, M, mao, Mc, o, van, vander, vonder, etc., son realmente parte del apellido, aun cuando estén escritos separadamente o con letras mayúscula.   Para el propósito de codificación, se deben considerar las distintas partes del apellido como si fuera un todo.

Ejemplos:

Di Bello
como si fuera
D i b e ll o
D-140
De los Santos
como si fuera
D e l o ss a n t o s
D-425
Di Aubigny
como si fuera
D i a u b i g n y
D-125
Mac Murray
como si fuera
M a c  m u rr a y
M-256
Van den Berg
como si fuera
V a n d e n b e r g
V- 535

Como se aplica el Sistema Soundex para archivar:
      Como se ha notado anteriormente, la primera letra del apellido es la letra “inicial” y todo el material está separado primero, según la letra (29 letras del alfabeto). Después se codifica cada letra separadamente y los códigos que resultan se agrupan  en una secuencia numérica.  Como la combinación más baja de números es 000 y la más alta es 666, cada letra está subdividida en esta secuencia numérica, comenzando con A-000 hasta A-666, C-000 hasta C-666, y asi hasta la última letra, Z-000 hasta Z-666.
     
      Una vez que el apellido está codificado, va a caer dentro de una categoría numérica definitiva. Cada apellido que tiene la misma letra inicial e idéntica combinación de números, códigos sin tomar en cuenta, diferencias en el deletreo de los apellidos, va a estar ubicado en esa sección particular del fichero.   Dentro de cada grupo numérico el material está archivado en estricto orden alfabético según el nombre o iniciales.

Ejemplos

H-100           Huf, Esteban
H-100           Hiba, Francisco
H-100           Hof, José Antonio
H-100           Heppe, José Ricardo
H-100           Hope, José Sebastián

En la práctica existirán letras que no contienen todas las posibles combinaciones, de números, y números que contienen tan pocos apellidos que no se justifica una guía especial. En estos casos se prepara una guía y detrás de ella se archivan las tarjetas en estricto orden alfabético según el nombre, nombres o iniciales, sin tomar en cuenta el código del apellido. Por ejemplo, en la letra “H”, la primera guía va a ser 000. Si hay solamente 4 ó 5 tarjetas para esta sección, y si hay 15 tarje­tas para los códigos 100-166, todas éstas tarjetas se van a ar­chivar detrás de la guía 000.                                            . ..

Ejemplos:

H-000
Hay, Alberto
H-120
Hoffes, Concepción
H-100
Huf, Esteban
H-100
Hof, José Antonio
H-000
Haua, Salvador
H-120
Habos, Tomás
H-200
Haack, Alejandro



Fuente: Material de apoyo Universidad de los Andes.

Publicado por Adela Ruiz

No hay comentarios.:

Publicar un comentario