网盘的最大特点是资源共享,说白了,就是同一个文件服务器上只需要存储一次,拥有这些文件的用户实质上只是拥有这些文件的链接。用的是云匹配技术,通过文件识别码的匹配,迅速找到服务器已有文件,从而在服务器与用户账号之间建立联系,根本不需要上传本地文件的具体数据,因而很快很省流量。当然,如果上传的是自己私有的东西,比如照片、自拍视频,就很难秒传了,需要用户的耐心等待。
不是,这个文件确实已经保存到你的网盘了。
不过,这是因为这个文件已经有别人上传过,百度云通过对比,发现已经存在这个文件,所以就不再重复上传你的这个文件了,只是把网盘上的那份增加到你的网盘。
应该对你上传的文件计算出MD5值或者其他值,然后在后台数据库搜索是否有这个值,有则从数据库获取网盘已有的文件连接和你网盘账号添加到数据库,即给你网盘账号添加了该文件,这样就秒传了。实际上文件被多个用户共享。
别人删除了资源,只要这个资源还有人拥有,就不会删除;即使所有人都删除了该资源(从回收站删除),网盘应该也不会真正删除,只是逻辑删除了数据库,资源没人拥有了,但依旧存在网盘,之后有人上传依旧可以秒传,这里称它为僵尸文件(类似于僵尸车),可能在2年、5年后依旧没人拥有就清除了。
在网盘已经存在的文件,如果你修改了一点内容,哪怕一个字符,MD5都会不同,就会认为文件不是同一份文件,网盘会重新上传。所以像同一个软件不同版本都是不同文件。
另外网盘应该做了异地备份处理,否则一旦一处数据被毁就很难找回来,一般情况下百度这么大公司很多数据库数据都会做异地备份。大公司对用户数据很重视的,数据丢失对公司来说是一件很重大的事故。包括数据泄露。文件管理、数据库管理一般都有专业的运维工程师在维护。