N届“采樱桃”盲听大赛发现金耳朵如何评价?– 麦文学看图说话系列
N届“采樱桃”盲听大赛发现金耳朵如何评价?– 麦文学看图说话系列
按:采樱桃(cherry picking)、隐瞒证据(suppressing evidence)、证据不完整谬误(fallacy of incomplete evidence)、或监视下的选择(observational selection)是一种非形式谬误,系指刻意挑选支持论点的资料呈现,而将重要但不支持论点的资料忽略不计。这个词语是源于采樱桃或其他水果的一般经验。挑水果的人把好的水果挑出来,看到的人可能会以为所有水果都是好的。这也是一种常见的学术造假手段。当然也可以用于市场营销玩噱头。
某论坛持续搞了多次盲听大赛并多次宣称发现金耳朵。 网友谈及有人因为质疑而被禁言,希望俺评论这个现象。
俺其实已经多次评论过这个类似耍猴的群众活动,这个活动没有统计学意义。因为没有设置对照/对照组, 整个活动就是过家家魔术表演而已。 相比家电论坛的八万元悬赏寻找金耳朵,根本就不是一个层次的实验设计。至少家电论坛的八万元悬赏寻找金耳朵的实验数据能用来做统计学检验。
一个简单的实例:
譬如台湾的大樂透、祖国的福彩体彩或者美国的Powerball彩票。
您買了一注大樂透,中頭獎的機率是 1 / 13,980,000。
如果您自己中獎,也許會說這是上帝的关照,您是 The Chosen One而不是机率,因為中獎的機率近乎 0。但全台賣了5,000,000 注大樂透,至少存在一注中頭獎的机率實是 30%。您不能举出有人中獎就否定大樂透開獎的随机机理。
换句话说,弄一个没有统计意义的实验(样本都不够而且没有设置对照组)然后宣称实验成功。这就是典型的造假,这就是 cherry-picking,只抓住自己想要发生的事件而忽略大多数没有听出区别的热心发烧友。 要知道报名的人群本身就是相信自己 100% 能听出区别的金耳朵。这个主动参赛的样本人群本身就已经浓缩一次了。临床试验设计中对照组设置原则sific.com.cn
这类似人群的发病率一样, 不可能只看门诊挂号人数, 而要放大到整个辖区甚至整个省份或者全国。不然就是可耻的 “采樱桃”, 数据造假。
一般来说,造假的人总是心虚的。 色厉内荏这个成语能形容造假的人。 语见(先秦孔子门人《论语阳货第十七》) “子曰:‘色厉而内荏,譬诸小人,其犹穿窬之盗也与?’”这也能解释为啥质疑的网友会被禁言,用一句俗语来概括就是“既要当*子又要立牌坊”. 还有一个成语能用来描述这种可笑的场景, 那就是欲盖弥彰。
欲盖弥彰,发音:yù gài mí zhāng;汉语成语,释义指想掩盖坏事的真相,结果反而更明显地暴露出来。出自先秦·左丘明《左传·昭公三十一年》:“或求名而不得,或欲盖而名章,惩不义也。 一般来说,造假的人总是心虚的。于是他们就禁止往届发现的发掘的”金耳朵“参加后来的比赛。即使彩票中奖一次, 第二次也难保再中不是?
当然关于牌坊的俗语设的前提俺是不赞同的,女性性工作者也能立牌坊。 例如杜秋娘,赛金花,小凤仙, 例如一位叫莺儿的青楼女子。莺儿让曹操改变了对女人的看法。曹操在《让县自明本志令》中对他的妻妾说:“顾我万年之后,汝曹皆当出嫁。”曹操受莺儿熏陶,让他的妻妾在自己死后全改嫁。可见性工作者也是有理想的。
采樱桃(cherry picking)、隐瞒证据(suppressing evidence)、证据不完整谬误(fallacy of incomplete evidence)、或监视下的选择(observational selection)
是一种非形式谬误,系指刻意挑选支持论点的资料呈现,而将重要但不支持论点的资料忽略不计。这个词语是源于采樱桃或其他水果的一般经验。这也是一种常见的学术造假手段。当然也可以用于市场营销玩噱头。源于采樱桃或其他水果的一般经验。挑水果的人把好的水果挑出来,看到的人可能会以为所有水果都是好的。
不管怎么说, 通过“采樱桃” 数据造假来误导发烧友是可耻的。
虽说吹牛🐮不用上税, 但如果别人吹牛, 咱来交税那就不合适了, 对不对?
为啥俺认为某论坛持续搞了多次盲听大赛是耍猴呢? 请看下面的资料:
无限猴子定理
让一只猴子在打字机上随机地按键,当按键时间达到无穷时,几乎必然能够打出任何给定的文字,比如莎士比亚的全套著作。在这里,几乎必然是一个有特定含义的数学术语,“猴子”也不是一只真正意义上的猴子,它被用来比喻成一个可以产生无限随机字母序列的抽象设备。这个理论说明把一个很大但有限的数看成无限的推论是错误的。猴子精确地通过键盘敲打出一部完整的作品比如说莎士比亚的哈姆雷特,在宇宙的生命周期中发生的概率也是极其低的,但并不是零。正如同玩彩票一样, 如果您把所有的彩票都买下来,肯定会中大奖。
知乎有个热门话题“如何一句话惹怒hifi烧友?”,
盲听/盲测又是一个禁忌。
您不能问:“您的听力是不是正常, 您上一次去医院测听力是啥时候了?”
至于盲听/盲测更是一个软肋, 如果您提到盲听/盲测,很可能朋友之间都会翻脸。
您知道信仰是个神圣的东西。
又如同玩彩票一样, 如果有人中大奖, 没有人会怀疑中奖的人是不是神仙下凡, 对吗。
盲听大赛如果只测7次,
那么只要有 2*2*2*2*2*2*2*2 = 256 的人次,
那不就出现了一只能打莎士比亚的全套著作的“猴子”了吗?
可目前电论坛的八万元悬赏寻找金耳朵的盲测/盲听, 都是一个令人垂泪的残酷的现实。
五轮擂台没有一个人能把 80000.00 人民币拿走。昨天还一耳朵听出线材区别, 视线接触不到商标以后突然特异功能丧失, 大家能不号啕大哭, 肝肠寸断么?
又到下结论的时候了吗?
某论坛持续搞了多次盲听大赛并多次宣称发现金耳朵这种情况类似于即开即奖型的彩票,开出了大奖以后捂着不公布,误导彩民继续摸奖。
这么比喻您觉得咋样。
【全文完】
================= 以下内容很散, 请勿阅读 ====================
================= 以下内容很散, 请勿阅读 ====================
================= 以下内容很散, 请勿阅读 ====================
图图大主教是南非领导黑人反对种族压迫的坚强斗士。
1984年他曾获得诺贝尔和平奖。图图主教能言善道。
1984年冬天,图图在美国纽约的一次宗教仪式上演讲时说:
“白人传教士刚到非洲时,他们手里有《圣经》,我们(黑人)手里有土地。
传教士说‘让我们祈祷吧’,于是我们闭目祈祷。
可是到我们睁开眼时,发现情况颠倒过来了:
我们手里有了《圣经》,他们手里有了土地”。
同样, 这个世纪里面。“耳机发烧友刚入坑时,
他们手里有人民币或者家里有矿,
大湿手里有线材、墙插、电处、地盒以及量子不干胶贴纸等等。
大湿说‘让我们烧 Hi-Fi 吧’,
于是我们闭目祈祷。
可是到耳机发烧友们睁开眼时,
发现情况颠倒过来了:
耳机发烧友手里有了线材、墙插、电处、地盒以及量子不干胶贴纸等等,
大湿手里有了人民币…… ”
关于翻译Peter Aczel文章第4节 听音 ABX 盲测
** 中文网上流传的版本, 吞了Peter Aczel 的原文很多文字。
Peter Aczel 老先生已经过世几年, 为了完整的传达这位歪果仁(很不巧俺也是歪果仁)的思想, 俺勉为其难用尽蛮荒之力靠初中文化重新翻译了最关键的地方。
大家请多批评。
原文:
https://www.biline.ca/audio_critic/mags/The_Audio_Critic_26_r.pdfwww.biline.ca
Peter Aczel 文章第四节 “(在家自测)听音 ABX 盲测”
译文:本刊(☞的是Audio Critic杂志)的常客都知道如何驳斥拜物的老烧反对双盲ABX测试所提出的各种谎言。以下就是一个简要的纵览:
ABX盲测法要求A和B设备的电平匹配到0.1dB范围内,之后参测人可随意听A和B,多久都行。如果认为它们有不同,可以要求去鉴别X, 其中X可以随机是A或者B(由系统随机打乱)。允许参测人随时对A/X、B/X进行比较。多少次都可以。最后决定X=A还是X=B。因为完全瞎猜,命中率会在50%左右(一半一半)。为了统计的正确性至少要测试12次(降低蒙中的几率到 1/2^12)。(16次抑或20次更好)。没有比这个更科学的方法来测试你是在听不同的东西还是在听同一个东西的了。
然而烧糊的老烧会说双盲测试完全不对:每个人都知道奇力比先锋好声,但如果他们在双盲测试中无法分辨奇力和先锋的话,就会耍赖说ABX盲测是行不通的。这就是他们的逻辑:(在生活中)如果每个人都知道Joe比Mike高,如果他们测出身高都正好都是5英尺11又1/4英寸的话,那尺子肯定有问题,对吧?
糊烧标准的反驳意见
之一就是ABX压力太大(换句话说你不能问:让我们来看看你能听力有多好吧?);
之二就是时间不够(因为要测16次所以一耳朵区别就消失了);
之三就是多只香炉多只鬼等等(诸如:继电器、开关和衰减器等);
还有其他能引用的主观听觉神论。
林林总总的目的就是东拉西扯躲避对照试验。
真相其实是这样的:
您可以自己独自完成 ABX 盲测, 也不需要受到旁人的干扰;
您爱折腾多久都可以(16个星期测16次不行吗?);
而且您也可以用直通来验证控制开关的通透性。
综上所述,那些反对的意见本质就是扯蛋和装逼。
教您一个法子来揪出一个狡猾的滥竽充数的反ABX测试的装逼犯:
问他相信其他AB对比测试吗,他可能会说信。
然后你问他到底靠什么办法分辨呢:
1.故意弄出不同的音量;
2.还是偷看厂标。
然后就等着他们如何撒泼吧。
以上就是第四节的译文。
Peter Aczel 文章的第四节是 “(在家自测)听音 ABX 盲测”, 然而网上流传的中文版本没有把最关键的段落翻译出来, 俺凭着初中文化勉强翻了出来给感兴趣的各位。
有些同学认为俺抄袭了中文网上的翻译。
大家请亲自过目, 对照一下以前的翻译吞掉了啥东西。https://www.biline.ca/audio_critic/mags/The_Audio_Critic_26_r.pdfwww.biline.ca麦文学:音响和耳机发烧圈的蘑菇原则zhuanlan.zhihu.com
科学家经研究发现,对饮酒者的大脑扫描显示,如果他们认为所饮的酒价格昂贵,那么从生理上会更加享受饮酒的乐趣。
这段话摘自 《华尔街日报》 专栏作家 Lee Gomes 的文章。
来源:《华尔街日报》中文网
If You’re Not Insane About Sound, Maybe You Can Just Go Crazy
By Lee Gomes
《华尔街日报》 英文网
Updated Jan. 16, 2008 11:59 p.m. ET
If you had to choose between two sets of speaker cables, one costing a few dollars and sounding fine, the other a few thousand dollars but perhaps sounding slightly better, and you chose the second pair, then you would have had a great time last week in Las Vegas.
The city’s many goings-on included The Home Entertainment Show, an audiophile trade show held in two small motels off the Strip. Audiophiles, as you probably know, are the hi-fi zealots who think nothing of spending $50,000 on a turntable. I’ve learned over the…Marketing actions can modulate neural representations of experienced pleasantness.www.ncbi.nlm.nih.gov临床试验设计中对照组设置原则sific.com.cn
补充阅读:
假设检验: 什么是非参数统计
什么是非参数统计
非参数统计是统计学的一个重要分支,它在实践中有着广泛的应用。所谓统计推断,就是由样本观察值去了解总体,它是统计学的基本任务之一。若根据经验或某种理论我们能在推断之前就对总体作一些假设,则这些假设无疑有助于提高统计推断的效率。这种情况下的统计方法称为“参数统计”。如果我们所知很少,以致于在推断之前不能对总体作任何假设,或仅能作一些非常一般性(例如连续分布、对称分布等)的假设,这时如果仍然使用参数统计方法,其统计推断的结果显然是不可信的,甚至有可能是错的。在对总体的分布不作假设或仅作非常一般性假设条件下的统计方法称为“非参数统计”。
由于非参数统计方法与总体究竟是什么分布几乎没有什么关系,所以它的应用范围很广,它在社会学、医学、生物学、心理学、教育学等领域都有着广泛的应用。由于有关于总体的假设,所以参数统计的推断方法是针对这个假设的。相对而言,非参数统计的推断方法是很一般的,它仅应用样本观察值中一些非常直观(例如次序)的信息。所以非参数统计分析含有丰富的统计思想。
非参数统计的适用范围
非参数统计最常用于具备下述特征的情况:
1、待分析数据不满足参数检验所要求的假定,因而无法应用参数检验。例如,我们曾遇到过的非正态总体小样本,在t-检验法也不适用时,作为替代方法,就可以采用非参数检验。
2、仅由一些等级构成的数据,不能应用参数检验。例如,消费者可能被问及对几种不同商标的饮料的喜欢程度,虽然,他们不能对每种商标都指定一个数字来表示他们对该商标的喜欢程度,却能将几种商标按喜欢的顺序分成等级。这种情形也宜采用非参数检验。
3、所提的问题中并不包含参数,也不能用参数检验。例如,我们想判断一个样本是否为随机样本,采用非参数检验法就是适当的。
4、当我们需要迅速得出结果时,也可以不用参数统计方法而用非参数统计方法来达到目的。一般说来,非参数统计方法所要求的计算与参数统计方法相比,完成起来既快且易。有些非参数统计方法的计算,就算对统计学知识不熟练的人,也能在收集数据时及时予以完成。
非参数统计的特点
非参数统计问题中对总体分布的假定要求的条件很宽,因而针对这种问题而构造的非参数统计方法,不致因为对总体分布的假定不当而导致重大错误,所以它往往有较好的稳健性(见稳健统计),这是一个重要特点。但因为非参数统计方法需要照顾范围很广的分布,在某些情况下会导致其效率的降低。不过,近代理论证明了:一些重要的非参数统计方法,当与相应的参数方法比较时,即使在最有利于后者的情况下,效率上的损失也很小。
由于非参数统计中对分布假定要求的条件宽,因而大样本理论(见大样本统计)占据了主导地位。第二次世界大战前,非参数统计的大样本理论已有了一些结果,从20世纪50年代直到现代,更有了显著的进展,尤其是关于秩统计量与U统计量的大样本理论,及基于这种理论的大样本非参数方法,研究成果很多。
————————————————————————————
对照, 对照, 对照
什么是“对照” ? 什么是“对照实验” ?
对照实验
一般进行某种试验以阐明一定因素对一个对象的影响和处理效应或意义时,除了对试验所要求研究因素或操作处理外,其他因素都保持一致,并把试验结果进行比较,这种试验为对照试验。通常,一个对照实验分为实验组和对照组。实验组,是接受实验变量处理的对象组;对照组也称控制组,对实验假设而言,是不接受实验变量处理的对象组,至于哪个作为实验组,哪个作为对照组,一般是随机决定,这样从理论上说,由于实验组与对照组无关变量影响是相等、平衡的,故实验组与对照组两者之差异,则可认定为是来自实验变量的效果,这样实验结果是可信的。
空白对照
指不做任何实验处理的对象组。例如,在“生物组织中可溶性还原糖的鉴定”的实验中,向甲试管溶液加入试剂,而乙试管溶液不加试剂,一起进行沸水浴,比较它们的变化。这样,甲为实验组,乙为对照组,且乙为典型的空白对照。空白对照能明白地对比和衬托出实验的变化和结果,增强了说服力。
自身对照
指实验与对照在同一对象上进行,即不另设对照组。单组法和轮组法,一般都包含有自身对照。如“植物细胞质壁分离和复原”实验,就是典型的自身对照。自身对照,方法简便,关键是要看清楚实验处理前后现象变化的差异,实验处理前的对象状况为对照组,实验处理后的对象变化则为实验组。
条件对照
指虽给对象施以某种实验处理,但这种处理是作为对照意义的,或者说这种处理不是实验假设所给定的实验变量意义的。例如,“动物激素饲喂小动物”实验,采用等组实验法,其实验设计方案是:
甲组:饲喂甲状腺激素(实验组);
乙组:饲喂甲状腺抑制剂(条件对照组);
丙组:不饲喂药剂(空白对照组)。
显然,乙组为条件对照,该实验既设置了条件对照,又设置了空白对照,通过比较、对照,更能充分说明实验变量——甲状腺激素能促进蚯蚓的生长发育。
相互对照
指不另设对照组,而是几个实验组相互对比对照,在等组实验法中,大都是运用对照,如“植物的向性”的等组实验中,5个实验组所采用的都是相互对照,较好的平衡和抵消了无关变量的影响,使实验结果更具有说服力。
对照实验是科学研究常用的一种实验方法,目的是通过对比实验的结果找到想要研究的因素对实验的影响作用,从而为科学的研究提供事实依据和直接证据。如在生物学、医学、农学、心理学和教育学等各领域中,有“没有对照就没有试验”的说法,因此,是否有适当的对照试验,在许多情况下会影响研究的成果。对照试验的技术有时比主试验还困难。再者,为了进行一个试验,必需有相当数量的对照才行,否则有时会分不清哪些是主试验,哪些是对照试验。与试验区、试验群相对应的也有用对照区、对照群名称的。作为试验对象,常常要求纯系的动植物材料和人的单卵孪生儿的道理就在于此。在物理或化学的领域里,由于研究对象系统的构成单纯,特殊的对照试验,在多数情况下没有必要。临床试验设计中对照组设置原则sific.com.cn
名词解释: 特发性的失聪
特发性的失聪: 蒙上眼睛或者视线被阻隔就突然发作的听力障碍。 这种听力障碍在移除眼罩或者阻挡物之后能瞬间康复。 特发性的失聪在音响发烧界的大师身上有极高的发病率。直接诱因就是盲听试验。概率分布 – MBA智库百科wiki.mbalib.com
二项分布、泊松分布、正态分布的关系hongyitong.github.io
。