The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

Проект Software Heritage нацелен на создание полного архива открытых исходных текстов

01.07.2016 10:31

Французский институт исследований в информатике и автоматике INRIA, при поддержке правительства Франции, ввёл в строй проект Software Heritage, задачей которого является сбор, сохранение и предоставление доступа к исходным текстам, собранным в одном месте из различных доступных источников. На базе Software Heritage создан крупнейший архив кода, ставящий перед собой задачу охватить все существующие открытые проекты и защитить доступный открытый код от возможной потери после закрытия сайтов проектов и репозиториев, а также дающий возможность организовать научные исследования над крупнейшей коллекцией кода.

В настоящий момент архив включает более 2.6 миллиарда файлов, охватывающих 23 миллиона открытых проектов и почти 600 млн коммитов. Архив включает код, размещённый в GitHub, в репозиториях Debian, коллекциях GNU и в других публичных архивах. Налажен процесс автоматической синхронизации изменений с GitHub, который скоро будет реализован и для других источников. Для запроса файлов пока можно использовать только контрольные суммы SHA-1.

Из планов на будущее отмечается расширение базы источников, реализация удобной навигации по коду и системы полнотекстового поиска, создание средств для отслеживания происхождения кода и цепочек заимствования, расширение метаданных и проведение статистических исследований, подготовка интерфейса для загрузки кода и истории изменений в форматах современных систем контроля версий.

Дополнительно можно отметить совместную инициативу GitHub и Google, в рамках которого подготовлено новое хранилище, расширяющее возможности GitHub Archive. Хранилище включает данные об активности в более чем 2.8 млн репозиториев на GitHub, 145 млн коммитах и 2 миллиардах файлов. Предоставлен интерфейс для поиска данных с использованием регулярных выражений, а также для формирования SQL-подобных запросов (например, можно определить наиболее часто используемые в коде модули, наиболее активных разработчиков, использование Emoji в коммитах и т.п.).

  1. Главная ссылка к новости (https://www.softwareheritage.o...)
  2. OpenNews: Проект GNU представил собственную платёжную систему GNU Taler
  3. OpenNews: Релиз открытой системы композитинга Natron 1.2.0
Лицензия: CC-BY
Тип: К сведению
Короткая ссылка: https://opennet.ru/44711-opensource
Ключевые слова: opensource, code, archive
При перепечатке указание ссылки на opennet.ru обязательно
Обсуждение (43) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (-), 11:13, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +6 +/
    Чтобы было натуральное наследие, надо все исходники перенести на глиняные таблички, а то какой-то ридонли гитхаб получается.
     
     
  • 2.4, hr4tklo45rhjy89o6y (?), 11:41, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +5 +/
    >глиняные таблички

    теРРабайты

     
     
  • 3.47, Аноним (-), 11:26, 04/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    Гигатонны терабайтов.
     
  • 2.8, Аноним (-), 12:13, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    У глиняных табличек плотность хранения маловата, лучше на фторопластовую перфоленту.
     
     
  • 3.11, none_first (ok), 12:29, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    > У глиняных табличек плотность хранения маловата, лучше на фторопластовую перфоленту.

    легкий пожар и...

     
     
  • 4.14, омномномнимус (?), 12:42, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +3 +/
    тогда чугуниевую
     
     
  • 5.18, тоже Аноним (ok), 13:19, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +4 +/
    Один колоссальный датацентр с высокой надежностью хранения стоит в Гизе уже четыре с половиной тысячи лет. Правда, технологии считывания до наших времен, увы, не дошли...
     
  • 4.17, FK (?), 13:07, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >> У глиняных табличек плотность хранения маловата, лучше на фторопластовую перфоленту.
    > легкий пожар и...

    Фторопласт не горит. Разве что расплавить можно..

     
     
  • 5.22, Аноним (-), 14:29, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • –1 +/
    А в клубок такую ленту можно замесить?
     
  • 5.56, анончик (?), 18:42, 15/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    А при термическом разложении некоторых видов фторопласта выделяется очень токсичный газ.
     
  • 2.35, Вареник (?), 20:28, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +1 +/
    >> а то какой-то ридонли гитхаб получается.

    Write-Only?

     
  • 2.54, Аноним (-), 17:20, 07/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    > Чтобы было натуральное наследие, надо все исходники перенести на глиняные таблички

    В Европе есть проект по переносу знаний на "топазные таблички". Между двух пластин топаза информация хранится в аналоговом виде и может быть прочтена с помощью простого в изготовлении аналогового проектора. Плотность довольно высокая. Картинки цветные. Гарантийный строк хранения не менее 1тыс лет. Стоимость одной "болванки" ~1000евро.

     
  • 2.55, Аноним (-), 18:10, 07/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    > Чтобы было натуральное наследие, надо все исходники перенести на глиняные таблички

    Есть M-Disk способен хранить информацию ~1000лет, читаться и пишется недорогими (обычными)  DVD.

    Есть кварцевые диски, способные хранить информацию миллиарды лет https://www.southampton.ac.uk/news/2016/02/5d-data-storage-update.page


     

  • 1.2, Аноним (-), 11:16, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Сто тысяч миллионов файлов средним размером 60 килобайт... У них Штщву-ов не хватит.
     
  • 1.3, Аноним (-), 11:36, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +5 +/
    Молодцы, французы, шарят. То золото заберут, то разживутся копией сорцов на собственных мощностях
     
  • 1.5, Аноним (-), 11:42, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    information must be free!
     
  • 1.6, hr4tklo45rhjy89o6y (?), 11:43, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Хочу торренты, чтобы у Я%&#@й пригорало.
     
     
  • 2.20, jgdhbfctbf5ceybebc5 (?), 13:25, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Вот для начала:

    https://www.debian.org/CD/torrent-cd/
    http://linuxtracker.org/
    https://meta.wikimedia.org/wiki/Data_dump_torrents
    http://www.kiwix.org/wiki/Content_in_all_languages/ru
    https://wiki.openstreetmap.org/wiki/Planet.osm#BitTorrent
    http://academictorrents.com/

     
  • 2.48, Аноним (-), 11:28, 04/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    > Хочу торренты, чтобы у Я%&#@й пригорало.

    Тебе не нравится пшеница?!

     

  • 1.7, Какаянахренразница (ok), 11:44, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +6 +/
    > нацелен на создание полного архива открытых исходных текстов

    Открывай меня полностью.
    https://www.opennet.ru/search.shtml?words=%D0%CF%CC%CE

     
  • 1.9, jOKer (ok), 12:18, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +12 +/
    "Кинутся тогда люди искать свои мебеля, а где они, мебеля? Вот они где! Здесь они! В шкафу. А кто сохранил, кто уберег? Коробейников. Вот господа спасибо и скажут старичку, помогут на старости лет… А мне много не нужно — по десяточке за ордерок подадут — и на том спасибо… А то иди попробуй, ищи ветра в поле. Без меня не найдут!" (с) Двенадцать стульев
     
  • 1.12, robux (ok), 12:39, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    "Создано централизованное хранилище".
    - вот как я прочитал новость. А между тем шёл 2016 год.
     
     
  • 2.26, Crazy Alex (ok), 16:37, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    Как ни крути - а это ещё один бэкап. Хотя если б они к своей копии дали какую-то возможность для желающих помочь - допустим, в виде торрентов - было бы хорошо, конечно.
     

  • 1.15, Аноним (-), 12:53, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Срезы архива будут?
     
  • 1.16, Андрей (??), 12:59, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    А ведь точно! Как раз в соседней новости про DMCA https://www.opennet.ru/opennews/art.shtml?num=44700 выяснилось, что свободный код безвозвратно удаляют. Интересно, они его успели заархивировать? Или они там архивируют только после цензуры?

    А вообще с историей всё выглядит печально: посмотрите на первые коммиты проектов: initial import from cvs. Один коммит! А в cvs же была целая история развития! Потеряна. Или они связываются с авторами на предмет, не сохранилась ли у них копия cvs? Вот это был бы действительно бесценный труд IT-археологов. Есть уже официально такая профессия?

     
     
  • 2.19, тоже Аноним (ok), 13:23, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    Судя по тонким знатокам фекалий мамонта, все больше IT-палеонтологи.
     
  • 2.38, Лев Исаакиевич Гуревич (?), 22:28, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    Про CVS точно подмечено, я один раз пол дня искал откуда и зачем взялся этот код:

    https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/tree/drivers/p

    И уже никто даже не помнит для чего он там, но выпилить мейнтейнеры очень бояться, из-за того, что у кого-то что-нибудь сломается.

     
     
  • 3.45, Аноним (-), 18:36, 03/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    > Про CVS точно подмечено, я один раз пол дня искал откуда и
    > зачем взялся этот код:
    > https://git.kernel.org/cgit/linux/kernel/git/torvalds/linux.git/tree/drivers/p
    > И уже никто даже не помнит для чего он там, но выпилить
    > мейнтейнеры очень бояться, из-за того, что у кого-то что-нибудь сломается.

    А комментировать код эти уeбaны так и не научились?

     

  • 1.23, Аноним (-), 15:48, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Сколько весит архивчик?
     
  • 1.24, Kodir (ok), 15:59, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Фильтрация на индусокод будет?
     
     
  • 2.27, Crazy Alex (ok), 16:39, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    Оно, насколько я понимаю, не о фильтрации, а ровно об обратном. Что лично мне больше всего и нравится.
     
     
  • 3.29, Аноним (-), 18:16, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    клоун: Что тебе нравится? Наивно полагаешь, что если кто-то выложить сворованный код Windows под лицензией GPL, то они не удалят его, как на git/gibhub? Удалят. Незамедлительно. И ещё настучат на всех, кто поимел наглость его скачивать. И твои жалкие стоны про "не трожьте свободный код!" их не остановят. Он не свободный, он контрафактный.
     
     
  • 4.31, Crazy Alex (ok), 18:27, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +3 +/
    Что там с виндовс-кодом и прочими испражнениями МС будет - вообще начхать, ибо даром не надо. А вот какие-нибудь результаты реверса, или методы джайлбрейка, или ещё что - могут иметь разный статус в разных юрисдикциях. Так что есть шансы, что хоть где-то, да выживет.
     
     
  • 5.33, Аноним (-), 18:52, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    клоун: Мне бы твои детские наивность и незамутнённость... В единорогов и розовых пони тоже веришь? Ведь есть шансы что они уже прилетели и порхают за твоим окном. Сходи, глянь.
     
     
  • 6.40, . (?), 05:31, 02/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    Это у тебя от страха клован, антидепресантов там попей каких. Скоро стипендии - конец, а кроме как *ать на форумах ты ничего не умеешь! Да ... ситуция! Запьёшь тут :(

    :)

     
  • 4.50, Аноним (-), 11:33, 04/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    > git/gibhub? Удалят. Незамедлительно. И ещё настучат на всех, кто поимел наглость
    > его скачивать.

    У меня есть этот код где-то в бэкапах. Почему-то мне за это ничего не было. За все 16 лет которые он валялся. Настучи на меня, чтоли.

     
  • 4.51, Аноним (-), 11:35, 04/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    > их не остановят. Он не свободный, он контрафактный.

    Да, код нотпада даже комментировали на програмерских ресурсах. Там такой контрафакт что даже китайцы с их пластмассовыми "ифонами" отдыхают.

     
     
  • 5.52, Аноним (-), 17:26, 04/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    клоун: Зря так говоришь. В своё время я пытался повторить notepad и узнал ОЧЕНЬ много нового о его возможностях.

    А на бестолковом хабре часто постят и комментят всякую хрень, выдавая её за божественные откровения.

     

  • 1.34, Вареник (?), 20:24, 01/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Молодцы. Хоть кто-то этим начал заниматься.

    >> при поддержке правительства Франции

    Ну не Сколково же. У нас только подслушку инновационно обязать хранить в голову чиновника может прийти.

     
     
  • 2.39, shlnkcbu4y43uqg (?), 23:51, 01/07/2016 [^] [^^] [^^^] [ответить]  
  • +/
    У нас write-only нанобэкап, это для кого надо бэкап.
     
  • 2.42, DmA (??), 08:25, 03/07/2016 [^] [^^] [^^^] [ответить]  
  • +2 +/
    ну это больше не чиновникам в голову пришло, а чекисткой опг защищающая "честно нажитое" . поездка на гелентвагенах чётко показывает менталитет чекистов и их детей закончивших академию фсб (организация пока ещё не запрещёная в России)
     
     
  • 3.43, Аноним (-), 17:58, 03/07/2016 [^] [^^] [^^^] [ответить]  
  • –1 +/
    клоун: на важные события (выпускной, свадьба, юбилей, похороны) люди часто арендуют дорогой автомобиль, ресторан или номер в дорогой гостинице. И это ничего не показывает.

    Работа в разведке интересует далеко не всех, сидеть в родной стране на хлебной должности и выгоднее и проще. А после их акции ото всех опасных должностей их избавят. Увидишь завтра этих ребят руководящих контролем за хранением персональных данных (модная тема) - выгодно и не пыльно.

     

  • 1.53, Mna (??), 13:19, 05/07/2016 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Хорошая новость. Конечно это должны были сделать французы, хорошо, что само правительство Франции взялось. Ведь Франция - сердце культуры. Посмотрите на список проектов inria.

    Если посмотреть кто автор CiteSeerX поисковика по научным работам, то это тоже француз, который, правда, перебрался для этого в Пенсильванию, штат, мотто которого "учить и обучать"

    Конечно это стоило бы сделать раньше: archive.org например существует давно. Но сейчас уже просто необходимо: в свете того что деструкторы принялись уже и это уничтожать

    Выше ДжОкерт шутит что собирать архивы сравнимо с работой старьевщика-коробейника, однако сорс-коды это другая материя, это даже не материя а явления из мира идей, и оно не гниет в этом смысле, а знания сохранить важно. (Когда говорят про "гниение кода" имеют ввиду, в организационном смысле, потерю уровня понимания работы кода в активном проекте. Соответственно неактивный проект гнить в организационном плане не может)

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Спонсоры:
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2020 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру