Seqanswers Leaderboard Ad

**Brian Bushnell** · 09-11-2014, 01:14 PM

BBMap can produce output that is helpful for this kind of thing:

Code:

Pairing data:           pct reads       num reads       pct bases          num bases

mated pairs:            100.0000%            1000       100.0000%             300000
bad pairs:                0.0000%               0         0.0000%                  0
insert size avg:          270.70


Read 1 data:            pct reads       num reads       pct bases          num bases

mapped:                 100.0000%            1000       100.0000%             150000
unambiguous:             98.4000%             984        98.4000%             147600
ambiguous:                1.6000%              16         1.6000%               2400
low-Q discards:           0.0000%               0         0.0000%                  0

perfect best site:       24.4000%             244        24.4000%              36600
semiperfect site:        24.4000%             244        24.4000%              36600
rescued:                  0.0000%               0

Match Rate:                   NA               NA        98.2567%             147385
Error Rate:              73.3000%             733         1.6680%               2502
Sub Rate:                73.3000%             733         1.6680%               2502
Del Rate:                 0.0000%               0         0.0000%                  0
Ins Rate:                 0.0000%               0         0.0000%                  0
N Rate:                  11.3000%             113         0.0753%                113


Read 2 data:            pct reads       num reads       pct bases          num bases

mapped:                 100.0000%            1000       100.0000%             150000
unambiguous:             98.7000%             987        98.7000%             148050
ambiguous:                1.3000%              13         1.3000%               1950
low-Q discards:           0.0000%               0         0.0000%                  0

perfect best site:       22.0000%             220        22.0000%              33000
semiperfect site:        22.0000%             220        22.0000%              33000
rescued:                  0.0000%               0

Match Rate:                   NA               NA        98.2627%             147394
Error Rate:              75.0000%             750         1.6660%               2499
Sub Rate:                75.0000%             750         1.6660%               2499
Del Rate:                 0.0000%               0         0.0000%                  0
Ins Rate:                 0.0000%               0         0.0000%                  0
N Rate:                  10.7000%             107         0.0713%                107

That gives you the exact number reads and bases with errors.

It also has a few other useful flags - such as ehist and mhist - that produce histograms showing error rate distribution.

Topics	Statistics	Last Post
Cancer Metastasis: A Deep Dive into Cellular Plasticity by seqadmin Started by seqadmin, 04-11-2024, 12:08 PM	0 responses 58 views 0 likes	Last Post by seqadmin 04-11-2024, 12:08 PM
Proteogenomic Profiles Offer New Clues in Prostate Cancer by seqadmin Started by seqadmin, 04-10-2024, 10:19 PM	0 responses 54 views 0 likes	Last Post by seqadmin 04-10-2024, 10:19 PM
Novel Diagnostic Assay Enhances Ovarian Cancer Detection by seqadmin Started by seqadmin, 04-10-2024, 09:21 AM	0 responses 45 views 0 likes	Last Post by seqadmin 04-10-2024, 09:21 AM
Evolutionary Dynamics of Centromeres: A Comparative Genomic Analysis by seqadmin Started by seqadmin, 04-04-2024, 09:00 AM	0 responses 55 views 0 likes	Last Post by seqadmin 04-04-2024, 09:00 AM

Seqanswers Leaderboard Ad

Announcement

how to verify large number corrected reads is correct?

Comment

Latest Articles

ad_right_rmr

News