Borrado de palabras repetidas....

Tema en 'Informática - Tecnología' iniciado por CI, 15 May 2007.

  1. CI

    CI Forista Legendario

    Registrado:
    25 Oct 2002
    Mensajes:
    13.115
    Me Gusta:
    44
    Ubicación:
    Barcelona
    Necesito los mas tonto del mundo...

    Tengo un archivo de texto, con bastantes direcciones de Email de clientes, pero en algunos casos hay repeticiones por error, o porque en mi base de datos , esa misma direccion de correo es para dos empresas...

    En fin.... del archivo de texto necesito alguna utilidad o programa que busque si hay repeticiones de cadenas de caracteres o palabras y borre una de las repetidas...

    He encontrado uno... pero , me borra todo lo que contiene una palabra , es decir si hay algun correo de hotmail, se los carga todos, no tiene en cuenta la arroba o la direccion inicial...

    Asias
     
  2. SPTR

    SPTR Forista Legendario Moderador Miembro del Club

    Registrado:
    18 Ago 2005
    Mensajes:
    9.218
    Me Gusta:
    854
    Ubicación:
    X
    Puedes probar con Excel.

    Saca ese archivo en modo de texto con los campos separados por comas (puedes usar la función buscar y reemplazar para convetir espacios en blanco en comas en el notepad mismo) o bien dejalo como está con espacios.

    Le das a abrir archivo y abres el TXT por ejemplo, y sigues el asistente para delimitar por espacio en blanco o coma las columnas.

    Seleccionas todos los datos y después vas a menú DATOS, FILTRO, FILTRO AVANZADO y picas.

    En la ventana que sale dale a filtrar copiandola a otro lugar.

    Donde pone Copiar a..., seleciona una columna o celda de destino (que luego se populará con todo).

    Después marca la casilla de sólo registros únicos y acepta. Si todo sale bien, debería haberse hecho una copia de la lista con los elementos repetidos suprimidos, dejándo solo uno de cada uno de los repetidos en vez de varios como tendrías antes.
     
  3. Apatito

    Apatito Guest

    Y digo yo... si es una BDD, ¿Porqué no te curras un Select que lo haga? :roll:

    :-k
     
  4. CI

    CI Forista Legendario

    Registrado:
    25 Oct 2002
    Mensajes:
    13.115
    Me Gusta:
    44
    Ubicación:
    Barcelona
    Ok SPTR... lo probaré....

    Apatito... a mi solo me llega el TXT......

    He encontrado algun programa.. como el Remove (Delete) Duplicate Lines in text file 7.0 (Joer que nombre mas largo....), el Dupli find y el Boxeer text editor 12.0.1, el Dupli find era la solución... aunque no está en Freeware y no lo encuentro de la otra manera.... JAJAJA...

    Salu2 ;-)
     
  5. Apatito

    Apatito Guest

    Sino lo pones en un excel y haces un filtro... es una idea... :-k
     
  6. randy_oz

    randy_oz Forista Legendario Miembro del Club

    Registrado:
    2 Abr 2003
    Mensajes:
    14.002
    Me Gusta:
    5
    Ubicación:
    Barcelona
    Unete a BMW FAQ Club Unete a BMW FAQ Club Unete a BMW FAQ Club
    y hacer un script en Unix????
    No creo que sea muy dificil...

    Salu2 ;-)
     
  7. CI

    CI Forista Legendario

    Registrado:
    25 Oct 2002
    Mensajes:
    13.115
    Me Gusta:
    44
    Ubicación:
    Barcelona
    Ok, ya lo he probao.... el problema es que con numeros va de coña... pero con Email... nastis... me coje el .com... o hotmail... y claro ... todas son repetidas...

    en cambio con 1, 2, 3, 4, 5... funciona de coña...

    Como se hace con Excel , que cada Email , lo pueda considerar todo una cadena de caracteres como un unico objeto....



     
  8. SPTR

    SPTR Forista Legendario Moderador Miembro del Club

    Registrado:
    18 Ago 2005
    Mensajes:
    9.218
    Me Gusta:
    854
    Ubicación:
    X
    Tienes que tener en la tabla, una columna por dato con títulos de lo que es mejor. (Al menos así lo hacía yo para filtrar por ejemplo PNP Ids de drivers, no creo que para esto sea muy diferente).

    Vale más una serie de imágenes que mil palabras:

    [​IMG]



    [​IMG]



    [​IMG]



    [​IMG]


    .... y esto es todo. Funcionar funciona.
     
  9. Chusko

    Chusko Forista Senior

    Registrado:
    15 Abr 2006
    Mensajes:
    6.245
    Me Gusta:
    144
    Ubicación:
    Castellar del Vallés
    Modelo:
    SprintGT1050
    con excel no puedes hacer una macro que te haga un COUNT de las palabras repetidas y te borre las que estan menos 1? yo diria que si...alguna hice yo en clase el año pasao...
     
  10. SPTR

    SPTR Forista Legendario Moderador Miembro del Club

    Registrado:
    18 Ago 2005
    Mensajes:
    9.218
    Me Gusta:
    854
    Ubicación:
    X
    Joer, ¿se ven las imagenes del post anterior? esque ahora no las veo... menua mierda, ya me pasa con todas las leches estas que no van las imágenes...
     

Compartir esta página