首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

离谱，深圳某公司重新定义8小时工作制！

教育 2024-09-09 09:00 福建

关注“FightingCV”公众号

回复“AI”即可获得超100G人工智能的教程

点击进入→ FightingCV交流群

活久见！近日，一家深圳公司明目张胆地耍起了小聪明，直接对传统的 8 小时工作制做了重新定义。他们把工作时间拆分成了三段：10:00-12:00：上午2小时；14:00-18:00：下午4小时；19:00-21:00：晚上2小时。

这样一算，2+4+2=8 小时，表面上符合标准的 8 小时工作制。

然而，关于午休和晚餐时间是否应当算入工作时间，法律并没有明确的条款说明。用人单位拥有一定的自主权，可以根据具体情况决定是否将这些休息时段纳入 8 小时工作时间的计算范围。

如果把通勤时间算进去，每天上下班大约各需一小时，这样的作息安排基本就等同于“朝九晚十”了。即便名义上是 8 小时工作制，实际投入的时间远远超过了 8 小时。

值得一提的是，这种作息安排在许多互联网公司其实并不罕见，特别是在快节奏、高强度的工作环境中，加班和灵活工作时间几乎成为常态。

往期回顾

基础知识

【CV知识点汇总与解析】|损失函数篇

【CV知识点汇总与解析】|激活函数篇

【CV知识点汇总与解析】| optimizer和学习率篇

【CV知识点汇总与解析】| 正则化篇

【CV知识点汇总与解析】| 参数初始化篇

【CV知识点汇总与解析】| 卷积和池化篇（超多图警告）

【CV知识点汇总与解析】| 技术发展篇 (超详细！！！)

最新论文解析

NeurIPS2022 Spotlight | TANGO：一种基于光照分解实现逼真稳健的文本驱动3D风格化

ECCV2022 Oral | 微软提出UNICORN，统一文本生成与边框预测任务

NeurIPS 2022 | VideoMAE：南大&腾讯联合提出第一个视频版MAE框架，遮盖率达到90%

NeurIPS 2022 | 清华大学提出OrdinalCLIP，基于序数提示学习的语言引导有序回归

SlowFast Network：用于计算机视觉视频理解的双模CNN

WACV2022 | 一张图片只值五句话吗？UAB提出图像-文本匹配语义的新视角！

CVPR2022 | Attention机制是为了找最相关的item？中科大团队反其道而行之！

ECCV2022 Oral | SeqTR：一个简单而通用的 Visual Grounding网络

如何训练用于图像检索的Vision Transformer？Facebook研究员解决了这个问题！

ICLR22 Workshop | 用两个模型解决一个任务，意大利学者提出维基百科上的高效检索模型

See Finer, See More！腾讯&上交提出IVT，越看越精细，进行精细全面的跨模态对比！

MM2022｜兼具低级和高级表征，百度提出利用显式高级语义增强视频文本检索

MM2022 | 用StyleGAN进行数据增强，真的太好用了

MM2022 | 在特征空间中的多模态数据增强方法

ECCV2022|港中文MM Lab证明Frozen的CLIP 模型是高效视频学习者

ECCV2022｜只能11%的参数就能优于Swin，微软提出快速预训练蒸馏方法TinyViT

CVPR2022|比VinVL快一万倍！人大提出交互协同的双流视觉语言预训练模型COTS，又快又好！

CVPR2022 Oral｜通过多尺度token聚合分流自注意力，代码已开源

CVPR Oral | 谷歌&斯坦福（李飞飞组）提出TIRG，用组合的文本和图像来进行图像检索

http://mp.weixin.qq.com/s?__biz=MzIzNzU4OTAxMQ==&mid=2247531368&idx=1&sn=42c2204d775a43126df8297b618bcda9

一个专注于解析计算机视觉、多模态方向前沿论文，解答科研问题，分享科研时事的公众号！

最新文章

211本二战字节视觉算法岗，拿下70k offer!!!

字节Chunyuan Li团队提出LLaVA-Critic:学习评估多模态模型

Video-ChatGPT：通过大型视觉语言模型实现详细的视频理解

多注意力深度伪造检测

Infinity-MM：利用大规模高质量指令数据扩展多模态性能

跨模态3D目标检测SOTA！易复现！

Apple提出《对比局部化语言-图像预训练》

TaskCLIP：扩展大型视觉-语言模型以用于面向任务的目标检测

Janus: 解耦视觉编码以实现统一的多模态理解与生成

开源模型突破原生多模态大模型性能瓶颈，上海AI Lab代季峰团队出品

ECCV24 ｜ ControlNet+⁣+: 通过高效一致性反馈改进条件控制

YOLO核心架构的演变路线

BLIP：用于统一视觉语言理解和生成的引导语言图像预训练

MMIU: 用于评估大型视觉语言模型的多模态多图像理解

Arena Learning : 通过模拟聊天机器人竞技场为 LLM 后训练构建数据飞轮

MMEvol：赋能多模态大型语言模型的 Evol-Instruct

NTU提出Text4Seg: 重塑图像分割为文本生成

BLIP-2作者新作Aria : 一个开放的多模态原生专家混合模型

华为天才少年面试大厂被怼：怎么连Attention都不会？

Mistral发布了其首款多模态模型Pixtral 12B

EMNLP 2024 | 阿里通义实验室提出MLLM多图能力评估基准MIBench

堪比理科博士生的最强AI大模型：GPT-o1技术解析

Google Deepmind提出SigLIP，用于语言图像预训练的 Sigmoid 损失

Apple提出MM1.5：多模态大型语言模型微调的方法、分析和见解

最优大语言模型模型架构深度解析

NeurIPS2024即插即用模块论文合集！

Qwen2-VL：增强视觉语言模型在任何分辨率下的世界感知能力

Kaiming He团队提出通过异构预训练Transformer 大规模扩展本体感知-视觉学习

LLaVA-OneVision｜更加高级的LLaVA，轻松的视觉任务转移

对齐器: 通过学习校正实现高效对齐

Emo-DPO：通过直接偏好优化实现可控的情绪语音合成

Jiaya Jia团队提出LLaMA-VID ：一张图片在大型语言模型中值两个token

mamba和Tranformer融合：通过混合架构高效扩展多模态大语言模型到 1000 张图像

小米提出MobileVLM：一种用于增强UI内部和跨UI理解的视觉语言模型

T2I-CompBench：一个用于开放式世界组合式文本到图像生成的综合基准

Molmo 和 PixMo: 开放权重和开放数据的最先进的多模态大模型

MG-LMM ｜指令引导的多粒度分割和字幕与大型多模态模型

Llama 3.2全文翻译：通过开放、可定制的模型彻底改变边缘 AI 和视觉

如何提升多模态大模型视觉推理能力？浙大杰青团队的新型自指导方案给出答案

THU鲁继文&NTU刘子纬团队联手发布 Oryx MLLM：实时应对任意分辨率的时空理解

SlowFast-LLaVA ｜ Apple团队提出视频大语言模型的强大免训练基线

AAA24 ｜震撼发布！95.3% 像素级 AUC：最强异常检测模型 SOTA 现已开源！

Google推出MaskGIT：革新图像生成的掩码式Transformer

英伟达发布NVLM：超越GPT4o，开源先锋塑造多模态AI新时代

TG-LLaVA｜沈春华团队提出通过可学习的潜在嵌入进行文本引导的 LLaVA

SAM4MLLM | 增强多模态大型语言模型用于指称表达式分割

CVPR2025投稿规定再次更新

ECCV2024 ｜一张图实现街道级定位，端到端图像地理定位大模型AddressCLIP

召唤100多位学者打分，斯坦福新研究：「AI科学家」创新确实强

SpaceX再创历史，人类首次商业太空行走成就达成！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉