Os métodos descritivos são tradicionalmente realizados com avaliadores treinados para analisar objetivamente os produtos, já que os consumidores foram considerados por muito tempo incapazes de realizar tais testes por serem influenciados por julgamentos hedônicos. Entretanto, nas últimas décadas, surgiram testes descritivos alternativos que utilizam consumidores nas análises. O check-all-that-apply (CATA) é um exemplo disso. Nesse contexto, o objetivo deste trabalho foi comparar o desempenho de avaliadores treinados e consumidores por meio de análise descritiva quantitativa (ADQ) – método tradicional e CATA – método alternativo, para 5 amostras de biscoitos semidoces laminados sabor baunilha com diferentes teores de alguns ingredientes: frutose (0,0 a 6,0%), aroma de baunilha (0,0 a 1,2%) e água (9,0 a 13,8%). Os biscoitos foram produzidos para este estudo, garantindo que a única variação entre as amostras foram os teores dos ingredientes supracitados. Foram analisados 23 atributos, tanto na ADQ quanto no CATA. A ADQ contou com a participação de 15 avaliadores treinados e o CATA, com 161 consumidores, que também realizaram teste de aceitação. Os resultados foram analisados por análises univariadas (análise de variância seguida do teste de Tukey (ADQ) ou Q de Cochran seguido do teste de McNemar (CATA), ambos a 5% de significância) e por análises multivariadas (Análise de componentes principais e Análise de correspondência, respectivamente para ADQ e CATA). Os dados do estudo indicaram que o número de atributos em que os avaliadores treinados perceberam diferenças significativas foi marginalmente superior (p<0,1) em relação aos consumidores. Para as diferenças mais sutis, os avaliadores treinados perceberam diferenças significativas em um número maior (p<0,01) de atributos (10) que os consumidores (2). Embora a distribuição das amostras nos mapas de percepção tenha seguido o mesmo padrão, os avaliadores treinados tiveram maior poder discriminativo do que os consumidores, ou seja, discriminaram as amostras em mais níveis de diferença. Já a descrição não foi semelhante, os dois tipos de avaliadores utilizaram diferentes atributos para descrever as amostras. Segmentando (análise de agrupamento ou de cluster) os consumidores em dois grupos para impressão global, observou-se que as médias foram maiores (p<0,05) para o grupo 1, sugerindo que este grupo é menos exigente para as amostras estudadas. O grupo 1 também demonstrou ser mais discriminativo em relação à aceitação que o grupo 2. Os direcionadores de aceitação também foram analisados e não foram os mesmos para os avaliadores treinados e para os consumidores. Por fim, conclui-se que consumidores podem ser menos discriminativos e usar atributos diferentes para descrever as amostras quando comparados a avaliadores treinados.