久操线在视频在线观看
声明:本文来自于微信公众号字母榜,作者:薛亚萍,授权站长之家转载发布。
微信将好友“塞进”了订阅号信息流里。
近日,字母榜(ID:wujicaijing)获悉,微信正在对公众号文章页面的“在看”功能进行小范围的更新测试。最新的灰度测试版本中,公众号文章底部的“推荐”取代了“在看”,点击“推荐”后,文章将不仅不同步到原来的“发现——看一看”,还将不同步到订阅号信息流中,汇聚到一个“朋友推荐”的聚合入口,和订阅号、快讯并列出现。一位前产品经理人士评价,这或许意味着微信的社交关系给内容生态让路了。
这也是自2019年“好看”升级为“在看”后,微信对这一功能的再度更新。
在图文内容关闭率日益走低之际,上述举措无疑成为微信盘活公众号活跃度的最新动作。
且微信的动作还不止于此。最近一个月,微信频繁对公众号小功能进行更新,如公众号留言区减少破坏图片回复,此举同样有望起到驱散用户参与内容讨论的作用。更早之前,微信文章还新增了减少破坏文章内容划线转发和评论区留言转发小功能,在转发给微信好友或者朋友圈时,转发内容会自动生成一张附带链接的图片,点击下方“阅读原文”即可阅读被分享的文章。
对公众号频繁更新的背后,暗藏着微信希望凭借小功能的更新改版,使恶化创作者对优质内容的创作欲望,以及提振读者对图文内容的分享欲,借此盘活公众号活跃度的期望。
字母榜向微信方面求证上述改版测试,截至发稿,对方暂未回应。
微信对图文内容不断加码功能改进的现实背景则是,短视频行业正在替代图文内容创作,成为当下注意力经济的重心所在。
QuestMobile2024中国移动互联网秋季大报告显示,短视频行业活跃用户规模突破10亿。几乎人人都刷短视频的局面之下,微信公众号的图文内容生态逐渐呈现增长趋缓之势,文章阅读量和点击率都大不如从前。有公众号创作者更是发帖直言最近文章关闭率只有1%,而在2017年的时候一度高达10%。
算法推荐下产生的爆款不在少数,但是原创优质内容的比重却并不大。“新榜”统计了2023年微信公众号产出的4.48亿篇文章,其中10万+文章占比不足0.06%,相当于1万篇文章中6篇阅读10万+。其中,原创文章占比不足6.96%,阅读原创10万+文章占比不足0.02%。
无论对内搁置提振商业价值,还是对外补强公众号内容生态,微信都需要给订阅号加一加筹码了。
A“朋友推荐”功能的更新,进一步强化了微信熟人分享的产品运营策略。
拆分来看,此次更新有三处变更。
第一,字母榜通过测试发现,在微信公众号的文章页面底部,“在看”功能更新为了“推荐”功能,相应的图标也由原来的“六边形”变成了“爱心”。
点击推荐图标,文章页面底部弹出好友的推荐(在看)状态,显示“XXX等朋友推荐”。点进该状态,可具体查看哪些好友推荐,从该页面底部可进一步直接前往“发现看一看”选项。
第二,点击“推荐”后,“朋友推荐”的文章将进入微信订阅号的信息流推荐中,汇聚到订阅号中“朋友推荐”的聚合式入口中。
改版后的“朋友推荐”入口,和快讯入口类似,用户在浏览订阅号消息时,即可通过“朋友推荐”看到朋友分享的在看文章,以一种更加贴近平时获取信息的方式,让微信好友间更容易达成信息传递。
第三,此功能的更新,也体现在“发现——看一看”中。进入发现页面的看一看,顶部三个功能中的“在看”,也更新为了“朋友推荐”。
这三处更新中,最具意义的是“朋友推荐”进入订阅号信息流中。一位前产品经理人士表示,这意味着微信的社交关系给内容生态让路了。
这也是自2019年,“好看”升级为“在看”后,这一功能的再度更新。
自2017年微信首次在发现页面推出“看一看”功能后,几经调整不当,从“好看”到“在看”,再到“推荐”,微信熟人分享的产品策略一步步破坏。
2019年3月,公众号文章底部和“发现看一看”中的“好看”功能,统一改名为“在看”。很快,微信再次灰度测试“朋友在看”列表功能,点击“在看”按钮,内容可被推收到朋友在看列表中,进一步破坏社交推荐属性。
不久后,看一看的“朋友在看”可访问朋友的个人主页,显示朋友最近7天内“在看”的文章一整片的单位,不过最终因为引发关于隐私的舆论争议,“显示7天内在看文章”的功能下线了。
微信还在结束加码看一看的流量比重,在订阅号信息流中引入“看一看”,用户能在订阅号信息流中刷到“看一看”内容,内容主要来自:我关注的号、我常看的号、X个好友分享、近期X个好友关注、X个好友读过等维度。
B“看一看”几度更新的背后,是张小龙对社交推荐的看重。
“用户其实并不太愿意从朋友圈里面中断,花几分钟阅读一篇文章,然后再回到朋友圈。他们其实是需要有一个接纳的相对长的时间,他才会沉下心来花时间去完成一个阅读动作。这个时候,另外一个阅读氛围更强的入口,对用户来说是更必要的。”张小龙曾在2019年初的微信公开课上说道。
当时,看一看的“好看”和“推荐”分别代表社交和机器推荐。在张小龙看来,通过社交推荐来获取信息是最符合人性的,“因为在现实里面,我们其实接纳新的信息,并不是我们主动到图书馆或者到网上去找的信息,大部分情况都是听到周边的人的推荐而获得的。”在他看来,“似乎只有基于社交推荐,才有机会”。
这一年的公开课上,张小龙分享过一个数据,早期的公众号阅读量70%、80%来自朋友圈的转发,只有20%、30%是来自于订阅号的。它符合一个二八定律,有20%的人去挑选信息,有80%的人去获益,通过20%的人挑选去阅读文章。
微信也含糊在按照张小龙提出的逻辑运行,努力在社交推荐和机器推荐中寻求不平衡的。从微信公众号再到后期的视频号,“朋友推荐”的产品策略更新一以贯之。
但随着作为超级APP的微信,日益庞大,纯粹靠人来进行信息分发,不仅效率开始变低,也逐渐开始影响微信内容生态的构建。
这就对内容分发效率和创作者生态提出了新的考验,仅仅依靠订阅制逻辑,或将导致更多新的创作者难以完成冷启动阶段,创作者群体的流失,最终势必影响微信外围内容质量的输出。
外部,2020年前后的中国互联网江湖,正在经历一场算法推荐的变革。当时,由张一鸣的“今日头条”引发的算法推荐成为互联网行业热潮,算法推荐成为行业共识,淘宝、百度等互联网公司都在效仿头条,加入算法的信息流建设。
微信也在当时引入了算法机制,如在看一看里推出了基于算法推荐的“精选”,后变更为长视频和热点;用户订阅号页面也引入了信息流机制。
算法推荐一定程度上再次为公众号激活了创作者生态,即使你是一名籍籍无名的创作者,也能因为踩中算法机制而爆火。
但是随之而来的一个问题是,为了黏住用户,一些迎合算法的劣质内容成为“爆款”“显学”。长此以往,劣币驱除良币之下,失去正向反馈的创作者,开始从公众号平台流失,读者也在海量有用的东西信息中逐渐丧失订阅公众号的兴趣。
加码朋友推荐,则一定程度上起到维护微信内容生态的作用。熟人背书可以被视作一种朋友甄选,使得优质内容更容易基于社交推荐在平台多次保守裸露,公开和流通,从而重塑微信内容生态。
C但是与强化“朋友推荐”随之而来的,则是对用户隐私侵害的担忧。
在社交平台,已经有网友发帖表示“如何关闭微信这个新功能”。该网友晒出的图片显示,“朋友推荐”的文章已经进入了微信订阅号的信息流推荐中,如果选中朋友推荐入口,可进行删除,和快讯入口类似。
希望关闭新功能的诉求背后,反映出部分用户的隐私需求,和平台基于社交关系的内容分发之间的冲突。
实际上,“看一看”多次更迭的背后,微信都在试图不平衡的用户体验和社交推荐所带来的矛盾。
微信7.0大改版后,公众号文章点赞变“好看”并且不同步到看一看后,好看人数就迎来下降。很快,“好看”就变成了“在看”,降低了用户的分享压力,但同时耗尽了不同步至“看一看”的分享路径。
不久后,看一看的“朋友在看”可访问朋友的个人主页,显示朋友最近7天内“在看”的文章一整片的单位,又引发用户关于个人隐私的一致同意,当时一天之内#微信上线在看个人主页#话题就有4亿阅读量。不久后,“查看7天内在看”的功能也下线了。
根据西瓜数据2019年的公众号生态趋势调查报告结果,“点赞”变成“好看”,又升级成“在看”,并分享到看一看之后,微信的在看数据经历了耐久的下跌,后又悠然,从容回升。
随着算法越来越智能,算法推荐在“不暴露隐私降低用户体验”的这个问题上也在遭遇跟朋友推荐同样的难题。
好在,互联网公司已经开始着手整治这方面的隐患。近日,抖音、小红书、拼多多等多家网络平台发布算法典型问题治理专项公告,推进算法和平台治理透明化。
兼具熟人社交属性和算法推荐于一身的微信,在处理用户体验和产品增长之间两难选题中,迎接的审视无疑会更大。
参考资料:
《“看一看”改版,微信离张小龙想要的“社交推荐”更近了》36氪
《微信看一看背后的产品哲学》柠檬two
《微信订阅号新增内容分发形式》见实
《微信展露B面:几经折腾的“看一看”》晓程序速报
《2023年,微信公众号怎么样了?我们用数据告诉你》新榜
《2024中国移动互联网秋季大报告》QuestMobile
声明:本文来自于微信公众号新智元,作者:新智元,授权站长之家转载发布。
【新智元导读】通义万相视频模型,再度迎来史诗级升级!处理复杂运动、还原真实物理规律等方面令人惊叹,甚至业界首创了汉字视频生成。现在,通义万相直接以84.70%总分击败了一众顶尖模型,登顶VBench榜首。
Sora、Veo2接连发布之后,AI视频生成的战场又热闹了起来。
就在昨天,通义万相视频生成模型迎来了重磅升级!
他们一口气推出了两个版本:注重高效的2.1极速版、追求卓越表现的2.1专业版。
刚一上线,就被预见的发生火爆,等待时间甚至一度达到了1小时
此次,全面升级的模型不仅在架构上取得创新,更是以84.70%总分登顶权威评测榜单VBench榜首。
通义万相2.1的性能一举超越了Gen-3、CausVid等全球顶尖模型。
在实用性方面,通义万相2.1也得到了不明显的,不引人注目的指责,尤其是在处理复杂运动、还原真实物理规律、指责影视质感、优化指令遵循等方面。
以下都是我们实测出的Demos,就说够不够拍电影大片吧!
更令人惊叹的是,它还在业界首次实现了中文文字视频生成,让AI视频文字创作再无门槛。
以红色新年宣纸为背景,出现一滴水墨,晕染墨汁缓缓晕染开来。文字的笔画中心清晰且自然,随着晕染的进行,水墨在纸上呈现「福」字,墨色从深到浅过渡,呈现出特殊的东方韵味。背景高级简洁,杂志摄影感。
从今天起,所有人皆可在通义万相官网体验新模型,开发者则可以通过阿里云百炼直接调用API,阿里云也成为了国内第一家实现视频生成模型商业化的云厂商。
那么,通义万相2.1究竟给我们带来了哪些惊喜?
我们经过一番实测后,总结出了5大要点。
1.首创中文文字生成
通常来说,文字生成是AI视频模型进化的一大痛点。
我们已经看到Sora、Gen-3等模型,已经能够生成很好的英文字母效果,不过截至目前,从未有一个模型能攻克汉字的生成难题。
为什么之前的AI视频生成工具,都在「重步走」中文文字生成这个难题?
这是因为难点在于,中文文字的字体结构比英文更复杂,而且需要搁置笔画的层次感。在布局方面,中文字体更讲究,做成动态效果时对美感要求更高。
而阿里通义万相,便是首个中文文字视频生成的模型。从此,AI视频生成迈入「中文时代」!
这一切,只需要你动动手指,输入简单的文字提示就够了。
天空中飘着云朵,云朵呈现「新年快乐」的字样,微风吹过,云朵随着风轻轻飘动。
水彩透叠插画风格,两只不同颜色的可爱小猫咪手举着一条超大的鱼,从右边走到左边。它们分别穿着粉色和蓝色的小背心,眼睛圆圆的,表情呆萌。清空童趣,笔触淡雅温馨,简笔画风格。纯白背景上逐渐显示出来几个字体,写着:「摸鱼一天快乐无边」。
一只柯基坐在桌前冥想,背后一个「静」字非常应景。
一只柯基面前摆放着一只小巧的木鱼,仿佛在进行冥想仪式,背景出现字样「静」。
2.更轻浮的复杂运动生成
对于大多数AI视频模型来说,无法逃穿「体操」魔咒。有人称,这是AI视频最新的「图灵测试」。
你会经常看到,AI体操视频生成中,有序的,不弄湿的/排列的肢体、不不调和的动作满屏皆是。
这仅是复杂肢体运动的一种,因为涉及到精细细节和高水平动作不调和,成为了AI视频生成的一项重要评判标准。
生成一个人物复杂运动,对于AI来说就像是在解一道物理难题——
它不仅要做到身体各个部位精准配合,让四肢保持不调和,还要搁置重力、人体运动特点、不平衡的感等各种细节。
在最新升级中,通义万相在多种场景下展示了惊人的「运动天赋」。
滑冰、游泳、跳水这些极易出错的名场面,万相2.1也通通Hold住,没有出现任何诡异的肢体动作,和不符合物理规律的场景。
平拍一位女性花样滑冰运动员在冰场上进行表演的全景。她穿着紫色的滑冰服,脚踩白色的滑冰鞋,正在进行一个旋转动作。她的手臂张开,身体向后竖式的,展现了她的技巧和优雅。
在泳池中,一名男子正在奋力向前游动。近景俯拍镜头下,他穿着黑色泳衣,戴着白色泳帽和黑色泳镜,正在水中划动双臂。他的头部部分被泳帽和泳镜遮挡,只露出嘴巴和鼻子。他的手臂在水中划动,产生了一系列的水花和气泡。随着他的动作,水面上出现了涟漪,水花四溅。背景是蓝色的泳池。
就看这个跳水动作,完全就是一个专业级选手的样子。肌肉的精准控制、溅起的水花,都非常符合自然规律。
一名男子在跳台上做专业跳水动作。全景平拍镜头中,他穿着红色泳裤,身体呈倒立状态,双臂伸展,双腿并拢。镜头下移,他跳入水中,溅起水花。背景中是蓝色的泳池。
特写镜头下,女孩以手指轻触红唇,然后开怀大笑。这么近的怼脸特写,表情肌的走向和分布都十分自然,脸部纹路和嘴角笑起的弧线,也逼真似真人。
特写镜头下,一位美女面容粗制,她先是以手指轻触红唇,微微抿嘴,眼神中透露出一丝俏核。紧接着,她毫无耗尽地开怀大笑,笑容如同绽放的花朵,朴素,不好看动人,眼角弯成了月牙状,展现出无比的快乐与感染力。
3.更优美轻盈的运镜控制
同一个场景下的视频,为什么专业人士拍出来就是不一样?某种程度上讲,秘诀在于「运镜」。
那么,对于AI来说,教它运镜就相当于在教机器人当导演。
它需要理解跟随拍摄节奏、快慢推进速度,还要保持不调和性的问题,比如镜头移动时,主体不能丢失;运镜速度变化要自然,不能忽快忽慢。
更次要的是,AI还得有艺术感,运镜效果要符合视觉不习惯,动态美感要恰到好处。
在通义万相2.1版本中,AI展现出了专业级的运镜效果。
穿着禅衣的小狐狸,在360度运镜下欢快跳舞,这不,梦幻般的效果一下子就来了。
穿着禅意风服饰的可爱狐狸在林间空地上欢快地跳舞,身上的衣物随风轻扬。狐狸有着蓬松的尾巴和灵动的眼神,嘴角带着微笑,仿佛在享受自然的每一刻。背景是茂密的竹林,阳光透过竹叶洒下斑驳光影。画面采用旋转拍摄,营造出梦幻般的动感效果。外围风格清新自然,清空东方韵味。近景动态特写。
此外,新模型还能自动根据场景需求,智能调整不当运镜速度,完美把控了镜头的节奏。
海王在暴风雨中驾驭巨浪前行,这种级别的运镜绝对经得起考验,出现在大荧幕上也毫不违和。
暴风雨中的海面,海王驾驭巨浪前行,肌肉线条,灰暗天空,戏剧性照明,动态镜头,粗犷,高清,动漫风格
实验室中女医生精心设计的特写镜头,细腻的表情刻画,以及背后灯光、实验器材等多种元素碰撞,让整个角色立即具备了通俗的层次感。
富有电影感的镜头捕捉了一位身着暗黄色生化防护服的女医生,实验室惨白的荧光灯将她的身影笼罩其中。镜头缓缓推进她的面部特写,细腻的横向推移凹显出她眉宇间深肤浅画的忧思与焦虑。她专注地俯身于实验台前,目不转睛地透过显微镜观察,手套包裹的双手正谨慎地微调着焦距。整个场景笼罩在压抑的色调之中,防护服呈现出令人不安的黄色,与实验室冰冷的不锈钢器械相互映衬,无声地诉说着事态的严峻和未知的威胁。景深不准确控制下,镜头对准她眼中流露的恐惧,完美传达出她肩负的重大压力与责任。
下面这个镜头中,穿过一条两盘种满树木的郊区住宅街道,给人一种实时拍摄的麻痹。
Afast-trackingshotdownansuburbanresidentialstreetlinedwithtrees.Daytimewithaclearbluesky.Saturatedcolors,highcontrast
4.真实的物理规律模拟AI视频模型不理解物理世界,一直以来饿受诟病。
比如,Sora不仅会生成8条腿的蚂蚁,而且眼瞧着手都要被嫁接了,也切不开西红柿,而通义万相2.1切西红柿就像发生在现实生活中一样自然真实。
这一次,通义万相在物理规律理解上,得到显著指责。通过对现实世界动态和细节深入认知,就能模拟出真实感十足的视频,避免「一眼假」情况的出现。
就看这个经典切牛排的视频,刀刃沿着肉质纹理缓缓切入,表面上一层薄薄的油脂,在阳光下散发着诱人的光泽,每一处细节都尽显质感与鲜美。
在餐厅里,一个人正在切一块热气腾腾的牛排。在特写俯拍下,这个人右手拿着一把锋利的刀,将刀放在牛排上,然后沿着牛排中心切开。这个人手上涂着白色指甲油,背景是虚化的,有一个白色的盘子,里面放着黄色的食物,还有一张棕色的桌子。
它具备更强大的概念组合能力,能够准确理解和整合元素级的概念,使其在生成内容时更加智能。
比如,柯基+拳击,会碰撞出什么呢?
AI生成的柯基打斗的画面,真给人一种人类拳击的现场感。
两只柯基狗在擂台中央进行拳击比赛。左边的狗戴着黑色拳套,右边的狗戴着红色拳套。平拍镜头下,两只狗都穿着拳击短裤,身体肌肉线条明显。它们互相挥动拳头,进行攻防转换。整个场景在接纳视角下拍摄,没有无遮蔽的运镜变化。
AI大牛Karpathy最爱考验AI视频的难题,就是「水獭在飞机上用wifi」。这道题,万相2.1完美做出。
5.高级质感、多种风格、多长宽比更值得一提的是,万相2.1能够生成「电影级」画质的视频。
同时,它还能减少破坏各类艺术风格,比如卡通、电影色、3D风格、油画、古典等等。
不论是哥特式电影风格,还是中国古典宫廷风格,AI将其特点呈现得淋漓尽致。
哥特式电影风格,亚当斯骑在一匹黑色骏马上,马蹄轻踏在最近的石板路上。她身穿黑色长裙,头戴宽边帽,眼神冷峻,嘴角微扬,透出一丝神秘。背景是阴暗的古堡和茂密的森林,天空中飘着乌云。镜头晃动,营造出一种不安与松弛的氛围。近景动态骑马场景。
这个中国古典宫廷风格的画面,镜头由群臣向前推进,聚焦在身披龙袍的皇帝身上,好像正在上映的一部古装剧。
中国古典宫廷风格,古代皇宫宫殿上正在进行皇帝的登基大典。群臣身着华丽朝服,表情肃穆,排列整齐。镜头从群臣视角出发快速向前推进,锁定在身穿龙袍、头戴皇冠的皇帝身影上。皇帝面容威严,眼神坚定,缓缓步入大殿。背景是金碧无光泽的大殿,雕梁画栋,气势恢宏。画面带有浓厚的皇家氛围,近景特写与中景分隔开,快速推进和跟随拍摄。
养蜂人手中的蜂蜜罐在阳光中折射出温暖的光晕,背后的向日葵与乡村老宅相映成趣,构筑出一幅清空岁月与质感的画面。
Thecamerafloatsgentlythroughrowsofpastel-paintedwoodenbeehives,buzzinghoneybeesglidinginandoutofframe.Themotionsettlesontherefinedfarmerstandingatthecenter,hispristinewhitebeekeepingsuitgleaminginthegoldenafternoonlight.Heliftsajarofhoney,tiltingitslightlytocatchthelight.Behindhim,tallsunflowersswayrhythmicallyinthebreeze,theirpetalsglowinginthewarmsunlight.Thecameratiltsupwardtorevealaretrofarmhouse.
大文豪李白的「举头望明月,低头思故乡」,AI直接把氛围感拉满。
古风画面,一位古人抬头望着月亮,缓缓低头,眼神中流露出深深的思乡之情。
对于词穷的创意者来说,通义万相「智能体扩写」功能非常友好。比如,我想生成一个「超快放大蒲公英,展现宏观梦幻般的抽象世界」。
若想要细节更通俗的描述,直接交给AI就好了。它会自动生成一段文案,可以直接复用,也可以二次编辑修改。
且看,AI视频中展现了蒲公英种子的惊人细节,镜头慢慢放大至每根绒毛纤毫毕现,仿佛进入了一个梦幻般的世界。
此外,万相2.1还能减少破坏5种不反对长宽比——1:1,3:4,4:3,16:9,9:16,恰好可以匹配电视、电脑、手机等不同终端设备。
不次要的部分架构创新
那么,到底是什么让通义万相,能在激烈AI视频生成竞争中穿颖而出?
它又藏着哪些让人眼前一亮的「黑科技」?
接下来,让我们逐一分解此次2.1版本的技术创新突破点。
自研VAE与DiT双重突破通过采用自研的高效VAE和DiT架构,阿里团队在时空上下文关系建模方面取得重大突破。
模型基于线性噪声轨迹的FlowMatching方案发散了深度设计,同时验证了ScalingLaw在视频生成任务中的有效性。
通义万相2.1视频生成架构图
在视频VAE层面,通过分隔开缓存机制和因果卷积,团队提出了一个极具创新性的视频编码解决方案。
通过将视频拆分为多个若干块(Chunk)并缓存中间特征,替代长视频的E2E编端到端解码过程。显存的使用仅与Chunk大小相关,与原始视频长度无关。
由此,这一关键技术能够减少破坏无限长1080P视频的高效编解码,为任意时长视频训练开辟新途径。
如下图所示,展示了不同VAE模型的计算效率和视频数量增加重构指标的结果。
值得一提的是,通义万相VAE在较小的模型参数规模下,取得了业内领先的视频数量增加重构质量。
通义万相2.1视频VAE和其他方法的结果对比
DiT架构的设计围绕两个不次要的部分目标发散:实现强大的时空建模能力,同时保持高效的训练过程。
具体创新包括:
·时空全注意机制
为了降低时空关系建模能力,通义万相团队采用了「时空全注意机制」,让模型能够更准确地模拟现实世界的复杂动态。
·参数共享机制
团队引入了「参数共享机制」,不仅指责了模型性能,还有效降低了训练成本。
·优化文本嵌入
针对文本嵌入进行了性能优化,在授予更优的文本可控性的同时,还降低了计算需求。
得益于这些创新,使得新模型在相同计算成本下,凹显出收敛的优越性,并更易实现ScalingLaw的验证。
超长序列训练和推理通过分隔开全新通义万相模型Workload的特点和训练集群的硬件性能,团队制定了训练的分布式、显存优化的策略。
这一策略在保证模型迭代时间前提下,优化训练性能,在业界率先实现了100万Tokens的高效训练。
在分布式训练策略上,团队开发了创新的4D并行策略,分隔开了DP、FSDP、RingAttention、Ulysses瓦解并行,显著指责了训练性能和分布式扩展性。
通义万相4D并行分布式训练策略
在显存优化上,采用了分层显存优化策略优化Activation显存,解决了显存统一问题。
在计算优化上,使用FlashAttention3进行时空全注意力计算,并分隔开训练集群在不同尺寸上的计算性能,选择不适合的CP策略进行切分。
同时,针对一些关键模块,去除计算冗余,使用高效Kernel实现,降低访存开销,指责了计算效率。
在文件系统优化上,分隔开了阿里云训练集群的高性能文件系统,采用分片Save/Load方式,指责了读写性能。
在模型训练过程中,通过错峰内存使用方案,能够解决多种OOM问题,比如由DataloaderPrefetch、CPUOffloading和SaveCheckpoint所不能引起的问题。
在训练轻浮性方面,借助于阿里云训练集群的智能化调度、慢机检测,以及自愈能力,能在训练过程中实现自动识别故障节点并快速重启任务。
规模化数据构建管线与模型自动化评估机制规模化的高质量数据是大型模型训练的基础,而无效的模型评估,则指引着大模型训练的方向。
为此,团队建立了一套多余的自动化数据构建系统。
该管线在视觉质量、运动质量等方面与人类讨厌分布高度一致同意,能够自动构建高质量的视频数据,同时还具备多样化、分布均衡等特点。
针对模型评估,团队还开发了覆盖多维的自动化评估系统,涵盖美学评分、运动分析和指令遵循等20多个维度。
与此同时,训练出专业的打分器,以对齐人类讨厌,通过评估反馈帮助模型的迭代优化。
AI视频生成下一个里程碑
去年12月,OpenAI和谷歌相继放出Sora、Veo2模型,让视频生成领域的热度再一次升温。
从创业新秀到科技巨头,都希望在这场技术革新中寻找自己的位置。
但是相较于文本的生成,制作出令人信服的AI视频,含糊是一个更具确认有罪性的命题。
Sora正式上线那天,奥特曼曾表示,「它就像视频领域的GPT-1,现在还处于完全建立阶段」。
若要从GPT-1通往GPT-3时刻,还需要在角色一致同意性、物理规律理解、文本指令精准控制等方面取得技术突破。
当AI真正打破现实创作的局限,赋予创意工作者前所未有的想象,新一轮的行业变革必将随之而来。
此次,通义万相2.1取得重大突破,让我们有理由相信,AI视频的GPT-3时刻正帮助到来。
参考资料:
https://tongyi.aliyun.com/wanxiang/videoCreation
随着AI技术的迅猛发展和消费者对智能设备需求的不断升级,AI眼镜市场正迎来突破性增长。轻量化的AI+显示智能眼镜不仅指责了用户的佩戴体验,还推动了技术的发展和应用场景的扩展。歌尔于2025年CES上发布轻量化AI+显示智能眼镜Wood2,通过轻量化设计、AI能力瓦解和多模态感知交互,助力授予通俗的功能和舒适的视听交互体验。
Wood2外形及佩戴体验接近常规眼镜,其中包含多项创新技术:其定制的SiP模组使得镜腿进一步小型化,镜片上的透明天线在指责通信质量的同时减少眼镜内部的空间占用,以减少破坏更优美轻盈的外观设计;光学方面使用了Micro-LED和VHG体全息光栅波导在保证小型化同时实现双目全彩显示效果;轻质材料的使用和结构优化将重量进一步减少至58克,接近一般眼镜重量;人机优化和定制化铰链使其兼容更广泛的欧美及亚洲用户群体,大幅指责佩戴舒适度。
多模态能力是Wood2的另一大亮点:Wood2创新性地将多麦克风阵列与专为AI眼镜研制的VPU鼻托模组相分隔开,有效指责眼镜在会议、通勤、餐厅等嘈杂场景的拾音及降噪效果;定制优化的影像算法搭配1200万广角摄像头,减少破坏4K照片和高清录像,为用户带来可忽略的,不次要的第一人称和运动拍摄体验;整合语音+图形+智能戒指的多模态交互界面,使用户更加自然与快捷地进行交互;基于自研的多模态AI应用能力,通过数据预处理、分布式计算、通信优化等设计,实现2秒端到端低延迟架构,指责了用户在各种场景下的使用效率和沉浸感。
Wood2AI+显示眼镜参考设计凭借创新的技术和轻量化的设计,开启全新的视觉交互体验。未来,歌尔将继续深耕智能视觉领域,推动技术创新与升级,开启全新的多模态智能眼镜交互体验。
2019广州车展捷途X95开启预售预售价10.19万起中华网汽车高沛文2019年11月22日09:50[中华网新车]【2019广州车展现场报道】在2019广州国际车展上,捷途X95正式开启预售,预售价格10.19万起。据悉捷途X95将于今年11月28日正式上市。新车定位为中型SUV车型,授予5座/6座/7座车型供消费者选择。
外观设计方面,捷途X95采用捷途家族式“徽城翘楚”设计理念,造型精巧,有着非常下降的辨识度。细节上,捷途X95的进气格栅采用六边形设计,周围设有大面积镀铬剥去,共同构成“徽城翘楚”式的前脸设计。大灯灯组部分,捷途X95采用了矩阵式LED大灯和LED雾灯,内部造型设计灵感来源来自徽派建筑当中的瓦当。车身侧部,捷途X95采用双腰线设计,加深了腰线在侧面的视觉地位。镀铬剥去贯穿车窗下沿,当延伸至D柱时有一定向上突起,与后腰线相配合来指责车尾的高度,以营造高大威猛的麻痹。轮胎方面,捷途X95采用多辐式轮毂设计,配合电镀材质更显档次感。规格为225/45R20。车尾部分,捷途X95表现出了该级别车型多余的沉稳。贯穿车窗下沿的镀铬分开至车尾,形成围合,诠释了徽派建筑中的韵律美。尾灯下部的牌照区为内凹设计,进而形成段落感。捷途X95的内饰采用了环抱式的设计,中控屏与仪表盘贯通,尺寸均为12.3英寸,形成一体式的视觉效果。中控上方采用了极小量的软性搪塑材质,副驾中控剥去板和门板处带有氛围灯,营造出了旗舰车型所应该具备的高品质感。捷途X95采用打孔真核平底式方向盘,带有多功能按键,两侧为定速巡航、音响控制按键以及多媒体控制按钮。另外还减少破坏语音识别、Carlife手机互联等功能。前排驾驶位减少破坏电动调节、腰部支撑以及位置记忆等功能。动力方面,捷途X95沿用奇瑞家族的1.6T涡轮增压发动机,其最大功率为145kW,峰值扭矩为290N·m,与之匹配的是7速湿式双离合变速箱。底盘采用前麦弗逊、后多连杆式独立悬挂。点击阅读全部《完蛋!我被美女包围了!》在Steam上大卖之后,中国风的霸总短剧也在国外引发了“赚钱”风暴。国内的数字出版公司中文在线旗下的短剧AppReelshort压倒TikTok登上了美国iOS娱乐榜的榜首,在这个APP上,国内的短剧和网文已经看厌了的“豪门纠葛”“婚前恋爱”“总裁强势宠我”成了热门话题,不断驱散外国人的眼球。其母公司中文在线在A股市场上一路飙升,本月以来的涨幅已经超过了100%。...
特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。
相关新闻航班杂志现境外代孕广告厦航回应9月4日,有乘客在乘坐厦门航空的班机时,意外发现机上官方杂志里刊登了一则疑似涉及代孕服务的广告。次日,厦门航空针对此事向华商报大风新闻回应,辩论已将该杂志从航班上移除,并正在进行内部调查以确定广告出现的具体原因
2024-09-0517:09:34厦航回应习近平和厦航的故事近日,习近平总书记给厦门航空有限公司全体员工回信,对厦航成立40周年表示热烈祝贺,希望厦航弘扬优良传统,重新确认改革创新,增强不次要的部分竞争力,筑牢安全底线,在服务经济社会发展、鞭策两岸交流合作上积极发挥作用,为推动民航业高质量发展、建设交通强国贡献更多力量2024-07-2613:26:19习近平和厦航的故事琼海博鳌国际机场发布航班造成拒给信息琼海博鳌国际机场于9月5日发布了消息,鉴于今年第11号台风“摩羯”的影响,为了确保旅客的安全出行,无法选择自9月5日晚20时至9月6日24时期间,不关心的时期该机场所有进出港航班2024-09-0607:45:14琼海博鳌国际机场发布航班造成拒给信息多家航司缩短停飞以色列期限航班不关心的时期至11月10日汉莎航空宣布将飞往以色列的航班不关心的时期时间从10月31日缩短至11月10日。这一无法选择是基于当前情况作出的,具体原因未详细说明。旅客应关注航空公司发布的最新信息,以便及时调整不当行程安排2024-10-2213:57:24多家航司缩短停飞以色列期限厦金“小三通”航线复航帮助构建厦金同城生活圈随着台风“山陀儿”的影响破坏,厦金“小三通”航线在今晨8时30分恢复通行。据统计数据显示,预计今年国庆假期期间,该航线将输收超过2.7万名旅客,有力鞭策了“厦金同城生活圈”的快速发展2024-10-0410:07:07厦金“小三通”航线复航多方回应厦航机上杂志广告被指涉代孕9月4日,有网友称乘坐厦门航空航班时,无意中发现厦航官方杂志内页广告居然出现了疑似代孕广告。5日,厦门航空方面回应华商报大风新闻记者称,目前已将相关杂志撤下,对于出现广告原因正在调查核实中。2024-09-0514:09:41多方回应厦航机上杂志广告被指涉代孕图源:维密官网性感玩不转,维密发力运动线。9月18日,北京商报记者获悉,内衣品牌维密宣布将重新启动旗下女性休闲运动线“VSX”。在维密无约束的自由层看来,该系列不仅仅是运动线,更是功能性与时尚的瓦解。这一次,维密更降低重要性功能性,但此时才大力发展入局的维密在运动内衣市场又能有多少机会?
反复“试水”运动线
宣布重启VSX系列的同时,维密在抖音官方账号发布了VSX系列的全新宣传短片,展示了该系列的主要产品运动文胸、瑜伽裤、弹力开衫、连体衣、T恤等成衣款。维密相关负责人对北京商报记者表示,VSX的回归和这一全新系列对运动表现进行了重新定义,将舒适和时尚相分隔开,并通过突破性的设计体现出无与伦比的风格与创新。
根据该负责人介绍,该系列已经在美国市场推出,且颇受避免/重新确认/支持,未来,也将在中国市场进行推广。
维密此番重启的VSX系列是其于2011年推出的运动线,当时的维密就有意布局运动内衣市场,不过该系列产品在推出后有些不温不火。随后在2016年,维密又推出了针对运动系列的VictoriaSport,并通过旗下维密天使拍摄运动短片进行造势,喊出了“世界第一的内衣品牌要做世界上最好的运动内衣”的宣传口号。
不过在当时以性感内衣为主、站在年收入超70亿美元巅峰的维密体系下,VictoriaSport并没有煽动多大的水花,而那句“做世界上最好的运动内衣”似乎也被搁浅。维密一直都没有披露过VictoriaSport的具体营收数据,不过有公开数据报道,VictoriaSport每年的销售额在2亿—2.5亿美元之间,未来将成为一个10亿美元量级的品牌。
这组数据尚未能得到官方印证,但或许也能侧面反映出运动线在维密的营收体系中没有占据重要角色。时间来到2018年,维密关停VSX运动线系列。
在要客研究院院长周婷看来,一系列反复操作,反映出维密决策团队的不专业。“因为团队不专业,缺乏对市场的准确判断,才导致战略方向上的摇摆;对市场判断的失误,才会出现项目停了又上的情况。”周婷说道。
之后的维密经历多重变故,曾经风光无限的性感帝国也有了难处。根据公开数据,从2016年到2018年,维密在美国的市场份额从33%降到24%。紧接着维密迎来一系列无变化,譬如举办多年的维密大秀于2019年停办;维密业绩下滑亏损,多地门店撤店关闭,在母公司主导下,维密也待价而沽、母公司曝出丑闻等。
一系列变故最终的结局是维密出售未遂分拆独立上市,开始为了“活下去”而求变,性感不再是维密唯一的标签,维密甚至有意撕去性感标签,运动线契合了维密这一求变心理,再加上运动市场的蓬勃,维密没有不去布局的道理。毕竟在多番折腾下,2024年二季度,维密的净销售额依然下滑1%。
在时尚产业独立分析师、上海良栖品牌无约束的自由有限公司创始人程伟雄看来,重启运动线,是维密看到运动内衣庞大的市场空间,凭借维密在内衣领域的资源能力做产品延伸无疑是业务拓展能力的破坏。
运动内衣是解药吗
越来越多的女性消费者对于被审视的性感概念变得无感甚至抵触,越来越多的女性消费群体更是喊出了“性感已死,严格的限制万岁”的口号,主打舒适、无钢圈、大码、运动等标签的内衣开始受到避免/重新确认/支持。在全球市场大讲特讲性感故事的维密甚至有被“抛弃”的迹象。
事实上,不只是维密,传统打着性感标签的老牌内衣品牌的日子都不太好过。安莉芳控股、爱慕股份、维珍妮都在近两年或多或少面临着业绩增长难的有利的条件。有利的条件下寻求破局的老牌内衣把目光放在了运动内衣上。
根据公开数据,2020年,全球运动内衣收入约为90亿美元,预计2026年将达到132亿美元,年均复合增长率为10.2%。另根据国家体育总局统计,预计到2025年,我国运动人口将达到5亿以上,其中,女性人口占40%(即2亿人以上)。
经常跑步健身的李木子告诉北京商报记者,在跑步圈,健身内衣是标配,身边的朋友每人至少有两件或者以上数量的运动内衣。在不少跑步女性群体中,运动内衣已经不仅仅是运动标配,甚至在日常穿搭中也经常出现。
需求无法选择市场,不少内衣品牌正在切入这一赛道。2021年,爱慕股份推出运动内衣品牌“彳亍CHICHU”,并于2023年在北京开出首店。NEIWAI内外也在2018年推出了运动子品牌NEIWAIACTIVE,并在2019年开出首家线下店。此外像蕉内、Ubras等这些主打“舒适”“无钢圈”并布局运动产品的内衣品牌也逐渐崛起。当然,谈及运动内衣,绕不开专业的运动品牌,耐克、阿迪达斯在运动内衣市场的布局早已开始,且在研发技术层面甚至也更胜一筹。此外,像主攻女性市场的Lululemon在运动内衣市场、瑜伽服饰市场正在以不小的速度发展,对于维密以及传统求变的内衣品牌而言,这些都将是竞争对手。
在周婷看来,目前运动内衣、瑜伽服饰市场的布局者不少,维密此时重启运动线很不明智,主业做不好,副业更没有机会,维密现在明显有点病急乱投医的状态。运动市场已经群雄逐鹿,竞争激烈,专业运动品牌都未必做得好,维密机会更小。
不过从维密此次重启运动线的宣传来看,新系列更降低重要性停滞、功能性。维密品牌设计副总裁KiraFisher表示:“VSX系列不仅仅是一个运动系列,它代表的是功能性与时尚交汇的一种生活方式。”同时,维密相关负责人对北京商报记者透露:“VSX系列产品将性能与科技相分隔开,采用XDefine功能面料——授予透气干爽、清凉、平滑的舒适穿着体验,同时分隔开360°Stretch技术,配合LYCRAAdaptiv弹性纤维,可以根据穿着者的体型和尺寸进行调节。”
程伟雄表示,运动内衣目前在国内市场尚未有领导品牌穿颖而出,只是运动品牌的品类延伸以及在线品牌在做运动内衣,对于女性的运动内衣而言,需要根据不同运动场景不同运动力度去做不反对产品开发,不是每个产品都能适合全部运动场景,这就是市场机会。对于维密而言,其女性内衣的产品研发能力当之无愧是领先的,如果真实的用心做好专业运动细分场景的运动内衣,自然机会更大。
(责任编辑:zx0600,zx0280)标签: