Seqanswers Leaderboard Ad

Collapse

Announcement

Collapse
No announcement yet.
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Metagenomics analysis with CLOTU: problems with input data

    Hi to all,

    I'm doing a metagenomic approach of environmental DNA with an amplicon library constructed with the ITS1 of one genera of fungi, with a total of four different libraries (4 MID's). I'm trying to analyze the data with CLOTU but I obtain the next log file:

    Make-Cluster: -i [accepted.fas] -p b -s [n] -c 50 -m 97 -l y -a 8
    make-FAS_FILE-EACH-Cluser: y accepted.fas blastclust_out.txt y
    Make-Matrix: -f METADATA.txt -t TPA.txt -g y -o [matrix]

    Manage file step completed

    Illegal division by zero at /usit/titan/u1/globus/CLOTU/VER-1.1/filter.pl line 444, <DATA> line 444216.
    Cannot open file "accepted.fas".
    Cannot open accepted.fas to READ
    Cannot open file "blastclust_out.txt".


    Seqs per file: 200
    Couldn't open 'cluster_out.fas': No such file or directory at /usit/titan/u1/globus/CLOTU/VER-1.1/clotu.pl line 225.

    Who know what is the problem?

    Another question is related to methodology. My library is very closed to the genera that we are studying, and we think that we don't have more than 20 species per sample (library). What is the best methodology that we can use? Assembly with Mira or Newbler is a good option?

    Thanks in advance

    Santi Català
    Valencia (Spain)

  • #2
    I forgot that my amplicons (300 bp) were generated on a Junior GS pyrosequencer.

    Comment


    • #3
      hello!

      I'm having similar problems, how do you finally resolve them?

      By the way, what about the assembly for fungi?

      I'm from Madrid, so if you want we can speak in Spanish

      Comment


      • #4
        Hola Miguel Ángel,

        Mi principal problema era de que disponía de un PC arcaico por lo que me veía obligado a hacer uso de una plataforma de este tipo. Hace unos meses conseguí hacer uso de un equipo de un grupo de unos colegas de otra Universidad, con lo que el Pipeline nos lo hicimos nosotros. Tras extraer los datos con el sff_extract hicimos el clustering con el BlastClust, y con la ayuda de un script en Python exporté a Fasta el Listfile, para poder trabajar con las secuencias de cada OTU. Me vi con el problema de una cantidad de errores, aparte de homopolímeros, increible, probablemente debida al uso de una polimerasa convencional tras preparar la librería por Nested-PCR, con lo que en lugar de coger a random sequence de cada cluster, hice un alineamiento para exportar una consenso, que fue la que utilicé para blastear. Éste último paso no tendría sentido si tuviera un número excesivo de OTU's, pero con la alta especificidad de los cebadores me quité muchos organismos de enmedio.

        Probé un ensamblaje con el MIRA, pero creo que no tenía mucho sentido hacerlo de esta manera, a pesar de que a nivel de diversidad de especies obtuve similares resultados.

        Si te interesa la metodología te la puedo pasar vía e-mail más detallada.

        ¿Qué tal tus secuencias? ¿Qué bichos buscas?

        Saludos cordiales

        Comment


        • #5
          Muchas gracias por la info!

          Nosotros estamos realizando los análisis de secuencias de bacterias, hongos y algas, obtenidas desde un 454 Titanium de Roche.

          Por ahora las secuencias parece que están bastante bien, lo que nos está suponiendo algo más de problema es su cribado y, sobre todo, su asignación taxonómica.
          Hemos usado por ahora unos scripts de BioPython y el SOP de mothur de Schloss et al, pero a la hora de asignar cada secuencia a cada bicho nos hemos encontrado con problemas: para Hongos no hay una buena base de datos pre-alineada con la que comparar, para algas ídem y para bacterias, la que hay (SILVA) casi no tiene cianobacterias (y las que tiene las confunde con DNA de cloroplastos), que son las que más esperamos tener.

          Por ahora estamos haciendo unos pasos con mothur y queremos probar que tal la asignación con CLOTU, que es bastante sencillito una vez he conseguido enterarme de cómo tienen que ir los archivos iniciales.

          Muchas Gracias

          Saludos!

          Comment


          • #6
            Bueno, pues igual para la siguiente placa te pediré consejo para meter los datos en el Clotu :-). Aunque con la poca diversidad que tengo me apaño bastante bien haciéndolo a mano.

            Por mucha casualidad, tus muestras no serán del Machupichu?

            Saludos!

            Comment


            • #7
              Encantado de poder ayudarte.

              Mis muestras no son de Machu Pichu, pero... ¿por qué lo preguntas?

              Comment


              • #8
                Nada, era mucha casualidad jeje. Hace unos meses estuve hablando con un colega de Madrid y me comentó exactamente la misma metodología que has utilizado tú para la asignación taxonómica, y él andaba trabajando con esas muestras, con todo tipo de bichos como tú jeje.

                Comment

                Latest Articles

                Collapse

                • seqadmin
                  Current Approaches to Protein Sequencing
                  by seqadmin


                  Proteins are often described as the workhorses of the cell, and identifying their sequences is key to understanding their role in biological processes and disease. Currently, the most common technique used to determine protein sequences is mass spectrometry. While still a valuable tool, mass spectrometry faces several limitations and requires a highly experienced scientist familiar with the equipment to operate it. Additionally, other proteomic methods, like affinity assays, are constrained...
                  04-04-2024, 04:25 PM
                • seqadmin
                  Strategies for Sequencing Challenging Samples
                  by seqadmin


                  Despite advancements in sequencing platforms and related sample preparation technologies, certain sample types continue to present significant challenges that can compromise sequencing results. Pedro Echave, Senior Manager of the Global Business Segment at Revvity, explained that the success of a sequencing experiment ultimately depends on the amount and integrity of the nucleic acid template (RNA or DNA) obtained from a sample. “The better the quality of the nucleic acid isolated...
                  03-22-2024, 06:39 AM

                ad_right_rmr

                Collapse

                News

                Collapse

                Topics Statistics Last Post
                Started by seqadmin, 04-11-2024, 12:08 PM
                0 responses
                26 views
                0 likes
                Last Post seqadmin  
                Started by seqadmin, 04-10-2024, 10:19 PM
                0 responses
                29 views
                0 likes
                Last Post seqadmin  
                Started by seqadmin, 04-10-2024, 09:21 AM
                0 responses
                25 views
                0 likes
                Last Post seqadmin  
                Started by seqadmin, 04-04-2024, 09:00 AM
                0 responses
                52 views
                0 likes
                Last Post seqadmin  
                Working...
                X