内容均不涉及转发、复制原文等,仅提供外链和标题聚合(可视做聚合引擎且非商业不盈利),查看详情请拷贝并跳转原始链接。如有侵权,还请告知。
新闻
DeepSeek将成为零售电商行业的“生意参谋”
概要: 在竞争日益激烈的零售电商行业,企业需要更加智能和高效的决策支持系统。DeepSeek正是应运而生的创新工具,致力于成为零售电商行业的“生意参谋”。本文将深入探讨DeepSeek如何通过大数据分析和人工……
Claude/混元/QwQ/DeepSeek 最全实测+拆解,谁最强谁翻车?
概要: 近期,Claude 3.7、混元(QwQ)、DeepSeek等推理模型纷纷推出新版本,引发了行业的广泛关注。为了探究这些模型的真实能力,本文通过编程、文本创作、悬疑推理、策略规划和实时信息搜索等五大任……
野生数据分析师脱困指南
概要: 在当今数据驱动的商业环境中,数据分析师的角色变得愈发重要,但同时也面临着诸多挑战。本文将从识别生存环境、应对工作挑战、提升自身能力等角度,为“野生”数据分析师提供一份实用的脱困指南。没人带、没人教、没……
14城今年新开地铁线路确定,多城排队报批新一期规划
概要: 今年多个中心城市都在政府工作报告中明确提出,报批新一期城市轨道交通建设规划。
深圳都市圈新进展:十天内两名深圳干部调任惠州、东莞副市长
概要: 未来或将有更多推进广州都市圈、深圳都市圈建设的举措出台。
抖音再不接入DeepSeek就晚了
概要: 尚未接入DeepSeek的抖音,刚刚把大门又敞开了一点点。近日,字节剪映的AI视频生成工具即梦被爆出正考虑使用DeepSeek。同时,即梦迎来新的移动端负责人,原零一万物PopAI产品负责人曹大鹏走马……
美国1月PCE符合预期,美联储6月降息希望重燃
概要: 反通胀趋势能否延续。
《使命召唤:战区》正在测试150名玩家比赛
概要: Raven Software 宣布即将对《使命召唤:战区》进行重大更改,该工作室正在试验150 人模式。Raven 透露,并非每一场比赛都会有 150 人,目前只是“间歇性”测试,工作室将在“未来几周……
3月3日!SpaceX“星舰”火箭迎来第八次试飞挑战
概要: 快科技3月1日消息,据央视报道,当地时间2月28日,美国联邦航空管理局(FAA)表示,美国太空探索技术公司(SpaceX)计划于3月3日进行“星舰”重型运载火箭的第八次试飞发射。回顾此前,1月16日,……
AI智能住宅革命:栖息地L32打造装完即住的理想家
概要: 2月28日,智能住宅品牌栖息地发布了全球首款搭载家庭AI Agent的智能住宅产品——栖息地L32。作为栖息地的首款旗舰产品,L32专为中国有孩子的城市家庭设计,代表三房两卫户型。栖息地L32以产品化……
撕开百威蜕变瓶,揭开新年好彩头 百威新春战役以「蜕变瓶」重构“年味儿”仪式感
概要: 2025年春节,一款可“撕开”的啤酒瓶,成为消费者热议的焦点。百威啤酒推出的新春限定版“百威蜕变瓶”,通过撕开外层瓶衣、揭开好彩头的互动设计,将蛇年“蜕旧焕新”的传统文化意象转化为具象化体验,以轻量化……
《宝可梦传说:Z-A》密阿雷市地图将会变得更加巨大
概要: 在宝可梦日,我们了解到了很多关于《宝可梦传说:Z-A》的新信息,不过其中一个隐藏的细节是,游戏中密阿雷市的地图竟然如此巨大。《宝可梦传说:Z-A》似乎整个故事都发生在密阿雷市,时间线在《宝可梦:XY》……
外卖骑手,“该”去哪?
概要: 在汉朝,“日行四百里”的邮寄速度使得从广州到北京理论上最快要跑15天。到了唐朝,这个时间可以缩短为10天以内,但这仍然只是帝王特权。比方说从岭南送杨贵妃的荔枝到长安。“一骑红尘妃子笑,无人知是荔枝来”……
宝可梦冠军表示《宝可梦冠军》将会改变竞技赛事格局
概要: 一位前宝可梦世界冠军表示,该系列的新竞技游戏《宝可梦冠军》可能会对宝可梦竞技赛事产生巨大影响。昨天,在2025年的宝可梦直面会上,任天堂和Game Freak除了着重介绍了《宝可梦传说:Z-A》之外,……
全球单芯片通量最高的纳米孔长读长测序仪发布
概要: IT之家3 月 1 日消息,华大智造 SEQ ALL 联盟年度峰会今日在杭州举行,全球单芯片设计通量最高的纳米孔长读长测序仪 CycloneSEQ G400-ER 正式宣布上市,华大智造为全球经销商……
9.98 万元蓝电 E5 PLUS 长续航先享版上市:搭载赛力斯超级电混系统,支持华为 HiCar4.0 车机系统
概要: IT之家3 月 1 日消息,赛力斯旗下蓝电 E5 PLUS 165km 长续航先享版车型今日宣布上市,限时一口价 9.98 万元,限量 1000 台,另可享以旧换新补贴 2 万元。此外,蓝电 E5 P……
控股股东变更为粤民投,辽宁成大新任董事长谈未来规划
概要: 如何解决辽宁成大和成大生物业绩承压问题?
从加盟商做到全球便利店第一,7-11做对了什么?
概要: 千万别7-11给骗了,它根本不是便利店,而是披着便利店外衣的快餐店,如果从门店数量来算,全球最大的连锁品牌麦当劳才3万多家,而7-11在全球门店高达近6万家。所以7-11才是真正的快餐之王。为了探究日……
鸿蒙智行 2 月全系交付新车 21517 辆,蝉联中国汽车品牌成交均价 TOP 1
概要: IT之家3 月 1 日消息,2025 年 2 月,鸿蒙智行全系交付新车 21517 辆,蝉联中国汽车品牌成交均价 TOP 1。IT之家随附鸿蒙智行官方公告中提到的部分数据如下:问界 M9 自 2024……
限定宁夏产区奶源:夏进全脂纯牛奶 29.8 元 15 瓶大促(京东 55 元)
概要: 天猫【夏进旗舰店】夏进全脂纯牛奶 243ml*15 瓶日常售价为 49.8 元,下单领取 20 元优惠券,到手价为 29.8 元:折合每瓶仅需 1.98 元,每斤仅需约 4.1 元,每 L 约 8.2……
强脑科技创始人韩璧丞:定义人机连接的中国方案
概要: 新华社杭州2月27日电(记者袁震宇、商意盈)2023年10月举行的杭州第4届亚残运会开幕式上,有一幕至今令人难忘:左上臂缺失的中国游泳运动员徐佳玲,用“意念”控制智能手臂,娴熟连贯地抓握起火炬并点燃圣……
AI走读新质生产力丨杭州强脑科技公司:迈向脑洞大开的未来
概要: 数字杭州,活力奔涌。超前的战略眼光,让杭州在创新领域率先起飞,从“杭州六小龙”引发的全球关注,堪称“杭州现象”……
分析预测黑曜石《宣誓》首月玩家接近600万
概要: 第三方统计机构mindGAME预测,黑曜石新作《宣誓》首月玩家接近600万(590万),超过了《夺宝奇兵:古老之圈》,后者玩家只有400多万左右。mindGAME会追踪游戏的数据,然后根据Xbox G……
海关统计条例拟修订,进出口按“经营活动发生地”统计有何影响?
概要: 修订草案拟将“进出口货物收发货人”调整为“进出口地区”,并且把“统计日期”改成了“进出口日期”。
C罗“体育频道”,真的来了?
概要: 如果你的比赛可以被C罗直播,意味着什么?流量?话题?知名度?这些词还是太虚浮了,作为一个严肃向的产业观察者,我们还是要把关注点放在一些更硬核、更实在的层面。比如,全球130多个国家和地区的传播覆盖,或……
2024年我国免签入境外国人人次翻番
概要: 转自:十堰发布2月28日,国家统计局发布的2024年国民经济和社会发展统计公报显示,2024年,通过免签入境外国人2012万人次,增长112.3%。
薛凯琪曾想轻生被方大同开导救下:活着才有希望
概要: 薛凯琪曾想轻生被方大同开导救下:活着才有希望
偶遇500年古榕树奇观!胡歌感叹:“一棵树就是一片森林,我好像经历了一次它的生长!”
概要: 偶遇500年古榕树奇观!胡歌感叹:“一棵树就是一片森林,我好像经历了一次它的生长!”
流言板全明星扣篮大赛预赛:矣进宏飞过两层人双手暴扣,得到46分
概要: 虎扑03月01日讯 CBA全明星单项赛扣篮大赛的比赛正在进行中。矣进宏飞过两层人双手暴扣,得到46分。 来源: 虎扑
下车即“上岗”,北京春风送岗开启“就业直通车”
概要: 转自:北京日报客户端农历二月伊始,北京西站地下二层地铁北出口3号旅客服务中心人头攒动,一场别开生面的招聘会让南来北往的旅客放慢了脚步。
现场直击杨曦皓第二扣45分
概要: 现场直击杨曦皓第二扣45分
流言板头球破门!恩凯蒂亚打入本季第4球,其中最近3场打入2球
概要: 虎扑03月01日讯 英格兰足总杯1/8决赛水晶宫对阵米尔沃尔的比赛正在进行中,第81分钟,恩凯蒂亚在门前接到理查兹的助攻,头球吊射破门。这是这位英格兰前锋本赛季打进的第4个进球。他最近3场比赛打进了2
刀郎,有新身份!
概要: 刀郎,有新身份!
去年前11个月全国检察机关办理侵犯知识产权犯罪案件1.3万件
概要: 转自:千龙网记者今天(28日)从最高人民检察院获悉,2024年1月至11月,全国检察机关共受理审查起诉侵犯知识产权犯罪案件1.3万件3.2万人,同比分别上升14.5%和10…
白敬亭章若楠hi6剧宣好甜 真的要被甜齁了
概要: 白敬亭章若楠hi6剧宣好甜 真的要被甜齁了
现场直击矣进宏第二扣45分
概要: 现场直击矣进宏第二扣45分
现场直击陈登星第二扣50分
概要: 现场直击陈登星第二扣50分
最美中轴线 第4季丨登陆少年组合和雅轻松回答中轴线小问题
概要: 最美中轴线 第4季丨登陆少年组合和雅轻松回答中轴线小问题
华交会展台变国际交友平台,不断拓展“商友圈”
概要: 转自:上观新闻2025年3月1日,第33届华东进出口商品交易会在上海新国际博览中心开展,聚焦纺织服装与轻工产业,深化开放合作,全面展示我国外贸转型活力与高质量发展成果。…
全国政协十四届三次会议新闻发布会将于3月3日举行
概要: 转自:财联社【全国政协十四届三次会议新闻发布会将于3月3日举行】财联社3月1日电,全国政协十四届三次会议新闻发布会定于3月3日(星期一)15:00在人民大会堂一层新闻发布…
全球第一土豪城,变成「诈骗天堂」了?
概要: 全球第一土豪城,变成「诈骗天堂」了?-36氪
查看1confirmation创始人:市值前十大代币中有4个都遵循了“加密VC”剧本
概要: 【1confirmation创始人:市值前十大代币中有4个都遵循了“加密VC”剧本】3月1日消息,1confirmation创始人Nick Tomaino在X平台发文称,在过去十年中,加密团队筹集了大……
在商业航天存储赛道打破海外垄断,这家成都公司拿下亿元融资 | 36氪首发
概要: 在商业航天存储赛道打破海外垄断,这家成都公司拿下亿元融资 | 36氪首发-36氪
查看Metis宣布推出AI专用的新高性能链Hyperion
概要: 【Metis宣布推出AI专用的新高性能链Hyperion】3月1日消息,Metis基金会Natalia在ETH Denver公布Metis推出新的高性能Layer2链Metis Hyperion,新链……
经典玩法“翻红”1年半,终于有出海厂商“上车”了?
概要: 经典玩法“翻红”1年半,终于有出海厂商“上车”了?-36氪
查看韩歆毅正式接任蚂蚁集团CEO
概要: 蚂蚁集团官网更新显示,蚂蚁集团前总裁韩歆毅正式接任蚂蚁集团CEO一职……
自研超声打断技术和全自动基因测序文库构建系统,「青元开物」助力基因测序设备国产替代|早期项目
概要: 自研超声打断技术和全自动基因测序文库构建系统,「青元开物」助力基因测序设备国产替代|早期项目-36氪
小说
盖世
概要: 盖世
论文
Distributional Preference Learning: Understanding and Accounting for Hidden Context in RLHF | Papers With Code
日期:13 Dec 2023
标签:None
描述:In practice, preference learning from human feedback depends on incomplete data with hidden context. Hidden context refers to data that affects the feedback received, but which is not represented in the data used to train a preference model. This captures common issues of data collection, such as having human annotators with varied preferences, cognitive processes that result in seemingly irrational behavior, and combining data labeled according to different criteria. We prove that standard applications of preference learning, including reinforcement learning from human feedback (RLHF), implicitly aggregate over hidden contexts according to a well-known voting rule called Borda count. We show this can produce counter-intuitive results that are very different from other methods which implicitly aggregate via expected utility. Furthermore, our analysis formalizes the way that preference learning from users with diverse values tacitly implements a social choice function. A key implication of this result is that annotators have an incentive to misreport their preferences in order to influence the learned model, leading to vulnerabilities in the deployment of RLHF. As a step towards mitigating these problems, we introduce a class of methods called distributional preference learning (DPL). DPL methods estimate a distribution of possible score values for each alternative in order to better account for hidden context. Experimental results indicate that applying DPL to RLHF for LLM chatbots identifies hidden context in the data and significantly reduces subsequent jailbreak vulnerability. Our code and data are available at https://github.com/cassidylaidlaw/hidden-context
Towards Fast and Stable Federated Learning: Confronting Heterogeneity via Knowledge Anchor | Papers With Code
日期:5 Dec 2023
标签:None
描述:Federated learning encounters a critical challenge of data heterogeneity, adversely affecting the performance and convergence of the federated model. Various approaches have been proposed to address this issue, yet their effectiveness is still limited. Recent studies have revealed that the federated model suffers severe forgetting in local training, leading to global forgetting and performance degradation. Although the analysis provides valuable insights, a comprehensive understanding of the vulnerable classes and their impact factors is yet to be established. In this paper, we aim to bridge this gap by systematically analyzing the forgetting degree of each class during local training across different communication rounds. Our observations are: (1) Both missing and non-dominant classes suffer similar severe forgetting during local training, while dominant classes show improvement in performance. (2) When dynamically reducing the sample size of a dominant class, catastrophic forgetting occurs abruptly when the proportion of its samples is below a certain threshold, indicating that the local model struggles to leverage a few samples of a specific class effectively to prevent forgetting. Motivated by these findings, we propose a novel and straightforward algorithm called Federated Knowledge Anchor (FedKA). Assuming that all clients have a single shared sample for each class, the knowledge anchor is constructed before each local training stage by extracting shared samples for missing classes and randomly selecting one sample per class for non-dominant classes. The knowledge anchor is then utilized to correct the gradient of each mini-batch towards the direction of preserving the knowledge of the missing and non-dominant classes. Extensive experimental results demonstrate that our proposed FedKA achieves fast and stable convergence, significantly improving accuracy on popular benchmarks.
每日夜间,随机给予一天的信息流,防止信息茧房(后续会接入更多信息源),感谢你的阅读!希望你能够从这边获取更多知识!