Skip to content

2.系统描述

oxogenesis edited this page Aug 16, 2019 · 9 revisions

系统描述

任何工具都只是实现个体意志的一种手段。
个体意志在逻辑世界的体现,是对数据的掌控。
个体在自己控制的设备内决定哪些数据被存储,在什么时候被使用。

要实现对数据的完全掌控,需要做到3个前提:

  • 识别数据
    个体要知道每个数据是什么数据,通过机器手段、或者人工手段,但最好是机器完成大量的预处理,机器实在搞不定再由自己来处理。
  • 解耦和数据
    企业出品的各种系统无法将消息、帖子等个体想看的数据和广告、推荐等个体不想看的数据分开,违背了个体的意志。 个体总是有的选,能做的就是不用这些系统,开发自己的系统,自己决定哪些人的哪些数据可以出现在眼前。
  • 本地化数据
    听个歌要请示下服务器,开个门要请示下服务器,换个地方登录还要向服务器证明你就是你,在网上干点啥都被各种系统记录、分析、针对性地应对,个体还活个啥意思?因此能够本地化的数据尽量本地化。

系统设计的指导思路:任何系统都只是个体掌控数据的一个工具,系统处理的数据应该是可识别的、解耦和的、可本地化的。
因此数据的规范是先于系统被设计定义,规范是对所有个体开放。
所有个体都可以基于数据规范开发自己的系统,或选择他人开发好的系统。
(每个人都有选择的可能性,行使选择权,可以防止社会资源被少数人垄断,第一步从解放数据开始)

系统帮助个体实现两类意志:

  • 与其他个体网上加密聊天
  • 发布公告供其他个体浏览

以下,将运行在个人计算设备的系统称为本地系统,为本地系统提供服务的系统(通常运行在服务器端)为远程系统

如果两个本地系统能够直接互联,并且不需要远程系统提供的服务,则远程系统没有存在的必要性。
如果两个本地系统不能直接互联,则至少需要远程系统提供数据中继服务。
如果本地系统需要远程系统提供服务,则远程系统是必须的。(这是句废话,为了严密,废话还是要的)

日常使用的互联网应用中,需要远程系统提供哪些服务?哪些远程服务是可以本地化?
所有的互联网应用都需要远程系统,因为现阶段的两个客户端是无法脱离远程系统直接互联,需要远程系统作为数据中继转发站,中继通常还涉及存储。
当然有些业务实际上并不需要走互联网,比如同一局域网(比如公司内网、家庭WIFI)两个人使用飞鸽传书聊天、传文件,几个人打联机游戏(星际争霸、帝国时代等),多数此类应用都是在互联网接入还没有这么普及、便利的时代产生的。
进入互联网时代以后,两个人在同一局域网内,聊天还是要通过微信,打王者荣耀、绝地求生还是要上互联网游戏平台。
技术和社会演化的路径,是提高生产力水平,提升服务多样性,高效的满足个体各式各样的需求。
因此在计算资源高昂,网络接入不便的年代,集中式的服务体系演化出了大数据、机器学习等等新技术。
降低每个人获取信息服务的成本,这是进步的一面。
但是慢慢也显露出了一些,不好苗头和趋势。
随着互联网企业市场份额接近天花板,创新乏力,巨头们都开始把触角延申到各行各业,依仗自己控制的数据和流量,压制创新和多样性,反而降低了个体的可选择范围。

远程系统提供的第2类服务是内容服务,主要包括文本、图片、音频、视频等人类能够直接感受的信息,和少量需要本地系统转换后才能被人感受的数据。
从内容来源来看,其中有一大类是用户生成内容(UGC),包括邮件、聊天消息、BBS、论坛、博客、微博、Vlog、自媒体文章、朋友圈、网络直播、弹幕、服务评价等(欢迎补充)。
就个体需求来讲,个体每天能处理的信息量是有限的,一个人能发多少邮件、聊多少天、看多少帖子。
在当前的技术水平下,个体已经完全可以负担的起UGC服务需要的计算、存储、网络等资源的费用了,将所有这类数据(视频类可能还不太行)都下载到本地,从本地发送是可行的。

个人数据存放在服务器上,始终是存在风险的。 谷歌、苹果、脸书、亚马逊、微软都为了提高语音数据的识别效果,采取了机器加人工的方式处理用户的语音数据,等同于对用户的监听。
大公司尚且如此,其他公司更不用说了,不要指望流出的数据不被利用(符合个人意志或违反个人意志)。

UGC应用多数都是人与人之间直接交互,远程系统只起到数据中继转发作用。
考虑到个体自己生成的处理的数据总量是很有限的,所有完全可以将这些数据(文字、图片,甚至音频)本地化。
这样就摆脱了对远程系统的数据存储依赖。

邮件、聊天消息本质上都是知道接收对象的定向消息。
BBS、论坛、微博、自媒体文章本质上都是不确定不在乎接收对象的非定向消息

未完待续

Clone this wiki locally